怎么用R语言去重

2023-02-12 11:47:02Python042

怎么用R语言去重,第1张

你的意思是不是按照剩余n-1列进行去重啊？

如果是这种，直接用duplicated函数，例如

set.seed(1234)

df <- data.frame(x1 = sample(c("Normal","Unnormal"), 10, replace = TRUE),

x2 = sample(c("a","b"), 10,replace = TRUE),

x3 = sample(c("c","d"), 10,replace = TRUE))

df[!duplicated(df[,-1]),] # 按第2,3列去重后的结果

如果是要去重且必须指定第一列值是“正常”，可以用dplyr包

library(dplyr)

df %>% group_by(x2,x3) %>% filter(x1 == "Normal" &row_number() == 1) %>% ungroup() #

R语言第二章数据处理③删除重复数据

果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C

2.去掉所有重复:A,A,B,C --->B,C

一般情况函数默认都是保留第一个重复。

比如：

在R中识别和删除重复数据：

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项，后者不包含重复的第一项。

duplicate()命令在开发版的do包中，CRAN上的do包并不包含这一命令。

安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数： df %>% group_by(a) %>% filter(n()==1)

最近正在学习R语言，碰到了因子factor，自己很不理解，网上找了很多的资料，可是感觉都说的很难，自己不是很理解，所以自己决定写一篇博客来帮助和自己一样有困惑的小伙伴。

首先，因子是离散的，它不是连续的，它只是一个标签。举个例子:

下面我们主要介绍一个关于因子的关键函数factor（）及他的一些参数！

这里主要说三个参数

x,我们主要传入的是一个向量，就像上面的例子一样。

为了研究第二、三个参数我们做如下test：

注意到，我们的元素是有重复的，细心的你，发现Levels: 1 2 3保存的是去重的元素，相当于python里面的集合，为什么会这样，或者说这样有什么好处，最大的好处就是节约存储空间，还有就是当数据很多且有很多重复的时候，你可以很直观的看到他真实的数据！

注意，我前面说了，factor的levels只是看不重复的的值，所以这些下该明白了吧。因为V里面不重复的就3个。

然后就会用我们实际需要的levels来一个一个替换，在实践中也是有这种需求的。

labels也可以实现，类比levels即可。传入的依然是c()向量。

主要函数的是因子命令

# 上一篇：零基础Java入门的前期准备？

# 下一篇：为什么苹果可以用两种编程语言开发应用？而安卓只能用JAVA。不能用其他呢？Go语言不支持安卓？

给您推荐相同类型的内容：

java如何多次解析填充pdf模板
java如何多次解析填充pdf模板操作如下：1、先去建一个Word文件，设置好想要填充的地方，留好位置，设置好下划线。2、将Word另存为pdf。3、打开电脑中的AdobeAcrobatproDC（这个应该win10都有，搜索一下就出来了）
java编程原理（简单的说一下)
Java的编程原理编译原理：先写Java的源代码。然后交给虚拟机虚拟机将其编译为字节码然后再进行运行。 Java的编译后的字节码，不是成为机器码。它必须要求有编译器在旁解释。它是解释型编译编程原理： Java 主要面向OO
java里面中的$是什么意思
java 正则表达式的写法，下面简单说一下：1、 ^ 和 $ 他们是分别用来匹配字符串的开始和结束 2、"^abc$": 就是要求以abc开头和以abc结尾的字符串，实际上是只有abc匹配。 3、如上的\n$就是以换行
go语言可以做什么
1、服务器编程：以前你如果使用C或者C++做的那些事情，用Go来做很合适，例如处理日志、数据打包、虚拟机处理、文件系统等。2、分布式系统、数据库代理器、中间件：例如Etcd。3、网络编程：这一块目前应用最广，包括Web应用、API应用、
php如何实现网页静态
一、静态化的优点:1有利于搜索引擎收录网站页面的信息：搜索引擎更喜欢静态的，更变于抓取，搜索引擎SEO排名会更容易提高。2静态网页化网页稳定 3可以提高网页加载速度4减轻服务器负担，浏览器不需要频发调用数据库。5数据库出错不会影响正常访问二
为什么苹果可以用两种编程语言开发应用？而安卓只能用JAVA。不能用其他呢？Go语言不支持安卓？
苹果公司允许开发人员使用 Objective-C 和 Swift 两种编程语言开发 iOS 应用，因为这两种语言已经紧密地与苹果的开发环境和工具集整合在一起。安卓操作系统原生支持 Java 语言，因此它是安卓应用开发的首选语言。但是，安卓
.net是做什么的？
.NET是一种用于构建多种应用的免费开源开发平台，可以使用多种语言，编辑器和库开发Web应用、Web API和微服务、云中的无服务器函数。云原生应用、移动应用、桌面应用、Windows WPF、Windows窗体、通用Windows平台（
ruby是什么意思
ruby的汉语意思如下：n.红宝石深红色。adj.红宝石的红宝石色的。ruby的读音是：英 [ˈruːbi] 美 [ˈruːbi] 。ruby的造句如下：1、RDT is a far more full-featured Ru
python_队列
1.队列是先进先出，列表可以读取某个指定数据 2.队列如果将储存的数据都读完就结束，列表可以反复读取例如：二、具体介绍一下queue 在使用queue的时候要先引入queue模块，创建对象~ 其中queue可以创建出
在影片(这个杀手不太冷)中扮演那个杀手的男人叫什么名字呀?
让·雷诺!!!中文名：让·雷诺英文名：Jean Reno出生日期：1948年7月30日出生地：摩洛哥卡萨布兰卡1948年让·雷诺出生于摩洛哥著名城市卡萨布兰卡。在他辉煌的演艺生涯中，曾与多位著名女影星合作过。1987年他与罗萨娜·阿尔盖特在
为什么不使用Go语言呢？
今年的早些时候我们对比过了几种native编程语言，包括D语言、Go、Rust和Vala。这里我们将分析来自Google的Go语言，看看他到底哪里跟别的语言不一样。 Go语言比其他的很多语言都吸引我，虽然我不是Go语言的专家，但是我很乐意在
简述.Net框架体系结构的组成。
.NET框架是一个多语言组件开发和执行环境，它提供了一个跨语言的统一编程环境。.NET框架的目的是便于开发人员更容易地建立Web应用程序和Web服务，使得Internet上的各应用程序之间，可以使用Web服务进行沟通。从层次结构来看，.NE
C语言编程用哪个软件好？
学c语言可以用的软件推荐如下：1、TurboC是由美国Borland公司开发的一套C语言程序开发工具，Borland公司是一家专门从事软件开发、研制的大公司。该公司相继推出了一套Turbo系列软件，如TurboBASIC、TurboPasc
python源代码
python在python shell中可以使用help(模块名)来查看模块的源码和其提供的功能；如果使用PyCharm的话，查看模块、类、方法的源码只需要名称上按住“ctr+鼠标左键”可以快速查看源代码。Python是一种代表简单主义思想
go和walk的区别和用法
go和walk的区别和用法：go强调的是走，并且go后面要加介，如go to work(去上班）walk强调的是步行方式，后面不用加介词，如Walk into the forest（在森林里散步）扩展资料例句：Now sh
鸿蒙HarmonyOS系统用户已突破3000万，跻身第三大操作系统？
华为HarmonyOS操作系统用户已经突破3000万，计划2021年底突破三亿台设备北京时间7 月 8 日，华为官方透露，华为 Harmony OS 2.0 用户已经达到 3000 万。新系统发布仅一个多月，相当于每天有一百
如何使用R语言编写牛顿插值公式对缺失值进行插值
LagrangePolynomial &lt- function(x,y) { len = length(x) if(len != length(y)) stop("length not equal!"
Visual C++.Net的开发语言是C语言还是C++？
你好Visual C++的基础是C++语言微软把这些东西都整合到.NET平台上了所以又叫做Visual C++ .NET意思是基于.NET平台的可视化C++开发好像是从VS 2003开始整合的VS6.0的时候还没有.NET平台可以使用只
php如何对比字符串内容？
PHP中，可以用双等号（==）或三等号（===）来比较字符串。x0dx0a二者的区别是：双等号不比较类型，三等号会比较类型，但不转换类型；用双等号进行比较时，如果等号左右两边有数字类型的值，刚会把另一个值转化为数字，然后进行比较。如果
java中“.d”是什意思
如果直接写sum2sum5sum10这样就是取整，但如果sum比分母小的话，那么就是0，这样程序就走不了啦.d是转换为double，这样就不是0，有个范围了。表示这个数字的类型为double 而不是 int不然的话要写成 427.0
c语言和.net
C#和.NET工程师没有本质的区别。因为.NET平台上开发的语言就是C#。但是.NET工程师好像会的多一些，不过没有用。企业要求的不是这个，而是精通。所以还是学好C#为本。Net：它不是语言，而是微软推出的开发平台，在这个平台上可以使用VB
c语言的表达式是什么？
您好，很高兴回答您的问题。在C语言中，表达式就是用数字、字母和各类运算符号综合在一起的式子，就叫表达式。用来表示变量间的某种关系，或者用来处理某个问题，比如a+b，a&gtb之类的，都可以称为是表达式。用运算符将运算对象连接形成的式
什么是net，net有什么优缺点
NET就是微软的用来实现XML，Web Services,SOA（面向服务的体系结构service-oriented architecture）和敏捷性的技术。.NET是微软的新一代技术平台，为敏捷商务构建互联互通的应用系统，这些系统是基于
JAVA中&&和||是什么意思？怎么用
JAVA中&amp&amp意思是“条件与”逻辑操作符，使用方法是x&amp&ampy，功能描述：x和y均为true,取值是true，否则取值是false。JAVA中｜｜意思是“条件或”逻辑操作符，使用方法是
.NET开发是什么？需要用到哪些开发语言？
.NET是微软基于Windows研发的一种开发平台，而.NET开发就是针对Windows平台进行的开发，.NET开发可以用C#语言，VB语言进行开发。.NET平台是基于Windows的开发平台我们平时用的电脑都是装的Windows系统，而.
python下载的库包放哪里
python下载的库包存放位置：打开python的安装目录，双击打开Lib文件夹找到“site-packages”文件夹并打开，下载的库包就出来了更多python进阶知识，请观看Python进阶视频教程！！python教程可以到【达内
JAVA类如何打开网页？
JAVA中的类是具备某些共同特征的实体的集合，它是一种抽象的概念，用程序设计的语言来说，类是一种抽象的数据类型，它是对所具有相同特征实体的抽象。所谓对象就是真实世界中的实体，对象与实体是一一对应的，也就是说现实世界中每一个实体都是一个对象，
python变量名的命名规则
Python语言变量命名规则变量名只能包含字母、数字和下划线。变量名可以字母或下划线开头，但不能以数字开头。例如，可将变量命名为message_1，但不能将其命名为1_message。变量名不能包含空格，但可使用下划线来分隔其中的单词。以下
JAVA数据结构有哪几种？
数组、栈、队列、链表、树、堆、图、散列表。1：数组是计算机编程语言上，对于“Array”的中文称呼，是用于储存多个相同类型数据的集合。2：栈是限定仅在表尾进行插入和删除操作的线性表，栈者，存储货物或供旅客住宿的地方，可引申为仓库、
go语言是一种什么语言
Go语言是谷歌推出的一种全新的编程语言，可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说：我们之所以开发Go，是因为过去10多年间软件开发的难度令人沮丧。Go是谷歌2009发布的第二款编程语

推荐阅读

热门文章

最新发布

标签列表

怎么用R语言去重

给您推荐相同类型的内容：