【R去重】保留第一个重复去所有的重复

2023-02-23 23:55:01Python012

【R去重】保留第一个重复去所有的重复,第1张

R语言第二章数据处理③删除重复数据

果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C

2.去掉所有重复:A,A,B,C --->B,C

一般情况函数默认都是保留第一个重复。

比如：

在R中识别和删除重复数据：

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项，后者不包含重复的第一项。

duplicate()命令在开发版的do包中，CRAN上的do包并不包含这一命令。

安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数： df %>% group_by(a) %>% filter(n()==1)

你的意思是不是按照剩余n-1列进行去重啊？

如果是这种，直接用duplicated函数，例如

set.seed(1234)

df <- data.frame(x1 = sample(c("Normal","Unnormal"), 10, replace = TRUE),

x2 = sample(c("a","b"), 10,replace = TRUE),

x3 = sample(c("c","d"), 10,replace = TRUE))

df[!duplicated(df[,-1]),] # 按第2,3列去重后的结果

如果是要去重且必须指定第一列值是“正常”，可以用dplyr包

library(dplyr)

df %>% group_by(x2,x3) %>% filter(x1 == "Normal" &row_number() == 1) %>% ungroup() #

第一个命令函数你的都是

# 上一篇：什么手机能用淘宝旺旺手机java

# 下一篇：幻想嘉年华 Special season是什么？

给您推荐相同类型的内容：

R语言学习笔记之聚类分析
R语言学习笔记之聚类分析使用k-means聚类所需的包：factoextracluster #加载包library(factoextra)library(cluster)l#数据准备使用内置的R数据集USArrests#load t
java抢购怎么解决先后问题
实务未完成前拒绝其他请求。但是很明显会影响效率并且有些请求可能永远拿不到这个锁。第一种方法：队列、就是将所有请求放到队列里，按照先来先处理，原则上这样所有请求最后都会被处理。但是当你处理速度长时间跟不上请求访问数，很可能会撑爆你的队列内存。
Java常见的分包规则，和命名方法
1．使用完整描述符来准确地描述变量、字段或类。例如，使用的名称可以是 FirstName、GrandTotal 或 Corporate Customer。虽然像 x1、y1 或 fn 这样的名称较短容易输入，但是它们并不提供任何信息指出它
r语言head函数什么意思
head(dataframe)——查看数据集前6行数据&lthead&gt标签用于定义网页文档的头部，它是所有头部元素的容器。&lthead&gt中的元素可以引用脚本、指示浏览器在哪里找到样式表、提供元信
下面哪句代码可以正确输出字符串python
字符串输出回顾一下以前我们经常写的print()输出数据,输出的就是字符串。下面来看看具体点的代码操作。代码如下: # 直接输出单引号或双引号或三引号格式字符串 print('hello world')...2.字符
R语言升级
先卸载了你的原始版本，装最新版，应该是2.9，安装好了后将原来的library文件夹里面的文件拷贝到新的安装文件中的library下，然后在R中运行：update.packages(checkBuilt=TRUE, ask=FALSE)。这
红帽linux中C语言编程如何调用数学函数
红帽linux中C语言编程调用数学函数参考案例如下所示：当需要调用函数的个数比较少时，可以直接在main函数中包含该文件，比如一个文件夹下包含add.c和main.c文件。文件add.c定义两个整数相加的函数,code如下：#include
bim在R语言中是什么
bim在R语言中是:1.几何和工程图中的“R”表示半径；热学中的“R”表示普通气体常数；电学中“R”表示电阻；试卷中的“R”表示正确。建筑信息模型（BuildingInformationModeling）是以建筑工程项目的各项相关信息数据作
java难学吗
java其实并没有想象中的那么难学，但是也不简单。不过还是要看你自己的一个学习的能力怎么样。Java应用广泛，课程体系全面，提到零基础通过自学Java最终找到一份Java开发的工作，其实这件事还是有难度的。没有好的学习教材以及良性的学习规划
DICKSON GOLF 请问这是一个什么牌子
迪森·高尔夫，是美国迪森高尔夫国际有限公司(USADICKSONGOLFINTERNATIONALLIMITED)，香港迪森高尔夫国际有限公司。有DS.GOLF(中高端真皮类)及RUBY.GOLF(非真皮类)两个品牌。走的是中低档路线，商场
dji go怎么切换语言
【安卓 Android 设备】app 的语言跟随手机系统的语言设置，若您需要修改 app 语言，直接调整手机系统的语言设置即可；【苹果 iOS】进入 app 主页，点击右下角【我】- 右上角【设置】-【设置语言】。 LiteIDE是一款专门
python里怎么终止程序的执行
quit() exit() 执行到此命令时，程序终止。如果是程序陷入死循环，想强制结束，则按Ctrl + C。这个特别关键。Python的设计哲学是“优雅”、“明确”、“简单”。因此，Perl语言中“总是有多种方法来做同一件事”的
Java开发进阶大数据开发工程师有难度吗？
不难，因为大数据以Java技术为基础，主要学习三个平台Hadoop、Storm和Spark。在熟练掌握了Java技术以后，再学习大数据的相关技术会容易很多。目前，Java也广泛应用于大数据、机器学习等领域，有大量成熟的解决方案是基于Java
python聚类分析散点图怎么分析
聚类分析。我们先从二维空间说起，比如一个组织中的雇佣关系存在四种模式，x轴和y轴分别代表着企业对员工提供的诱因与企业对员工期望的贡献。两个坐标轴划分出了四种雇佣关系，企业对员工提供的诱因与企业对员工期望的贡献两个指标共同可以反映一个企业的员
怎么用debug c语言
简单来说，有两种方式，一种是源码debug，即分析源码来找出bug位置，一般使用printf()打印出程序执行每一步的信息，一种是可执行文件debug，需要使用调试器来进行。1、源码debug类似于下面的源码，主要通过程序执行时输出的信
Python中如何清屏
本文实例讲述了python实现清屏的方法。分享给大家供大家参考。具体分析如下：2&gt&gt&gtimport os &gt&gt&gtos.system('cls')
matlab中disp(fval) disp(exitflag) 是什么意思
如果前面完全没有出现过 fval和exitflag那样肯定会报错仔细看看你原来的代码有没有这两变量的出现这两个变量应该是一些优化函数输出的结果，而且一般是第二第三输出结果注意你前面的代码中有没有出现，类似[x,fval,exitflag]
学习C语言要多长时间
学习C语言要一个月左右时间。C语言能以简易的方式编译、处理低级存储器。C语言是仅产生少量的机器语言以及不需要任何运行环境支持便能运行的高效率程序设计语言。尽管C语言提供了许多低级处理的功能，但仍然保持着跨平台的特性，以一个标准规格写出的C
如何在windows下安装GIT
本文在Windows7下测试成功。安装和设置Git下载Git for Windows，采用默认安装，安装完成后就可以在本地使用Git了。但要将内容放到Github上，必须先在Github网站上注册个账户，然后在本机使用Git创建SSH Ke
北大青鸟java培训：大学生为什么要成为Java人才？
目前来说，在当下经济快速发展的当下，企业的用人要求也越来越高，人人都力争成为某个行业的人才，确保自己的核心竞争力，目前来说，在IT行业中，软件行业人才需要最大，特别是对于Java人才的需求，那么企业是处于“高薪难求”的状态。IT培训http
golang 正则 regexp包使用
先介绍几种常用的方法： 1、使用MatchString函数或Match函数 regexp.MatchString(pattern string, s string)pattern为正则表达式，s为需要校验的字符串 rege
malloc函数的用法是什么？
C语言中malloc是动态内存分配函数。函数原型：void *malloc(unsigned int num_bytes)参数：num_bytes 是无符号整型，用于表示分配的字节数。返回值：如果分配成功则返回指向被分配内存的指针(此
北大青鸟java培训：Using的使用？
In.net大家庭,有相当多的关键词进行各种各样的角色,如new的关键字是多元化,除了能够创建对象,隐藏在继承系统基类成员,也限制在一个通用的声明中可以使用类型参数的参数,在第五回:一个简单的关键字——通过新的说话]我们已经详细讨论。湖北电
驳狗屎文 "我为什么放弃Go语言
此篇文章流传甚广, 其实里面没啥干货，而且里面很多观点是有问题的. 这个文章在 golang-china 很早就讨论过了.最近因为 Rust 1.0 和 1.1 的发布, 导致这个文章又出来毒害读者.所以写了这篇反驳文章, 指出其中的问题
Python中大小写字母转换
1. 在python中主要有四种转换方式，如下图 2. 这里我们举例说明各自的用途： #大小写转换 str3 = "Hello" str4 = "WORLD" str5 = &qu
java抢购怎么解决先后问题
实务未完成前拒绝其他请求。但是很明显会影响效率并且有些请求可能永远拿不到这个锁。第一种方法：队列、就是将所有请求放到队列里，按照先来先处理，原则上这样所有请求最后都会被处理。但是当你处理速度长时间跟不上请求访问数，很可能会撑爆你的队列内存。
java中的反射机制是什么？有什么作用呢？求解，谢谢。
Java反射机制详解1. 反射机制是什么反射机制是在运行状态中，对于任意一个类，都能够知道这个类的所有属性和方法；对于任意一个对象，都能够调用它的任意一个方法和属性；这种动态获取的信息以及动态调用对象的方法的功能称为java语言的反射机
如何用R语言for循环形成112358
赋默认值，在for循环中进行修改。编程中减少代码重复的两个工具，一是循环，一是函数。循环，用来处理对多个同类输入做相同事情（即迭代），如对不同列做相同操作、对不同数据集做相同操作。R语言有三种方式实现循环：for循环、while循环。app
Go语言文件操作
本文主要介绍了Go语言中文件读写的相关操作。文件是什么？计算机中的文件是存储在外部介质（通常是磁盘）上的数据集合，文件分为文本文件和二进制文件。os.Open() 函数能够打开一个文件，返回一个 *File 和一个 er
如何看待go语言泛型的最新设计？
Go 由于不支持泛型而臭名昭著，但最近，泛型已接近成为现实。Go 团队实施了一个看起来比较稳定的设计草案，并且正以源到源翻译器原型的形式获得关注。本文讲述的是泛型的最新设计，以及如何自己尝试泛型。例子FIFO Stack假设你要创建一

推荐阅读

热门文章

最新发布

标签列表

【R去重】 保留第一个重复去所有的重复

给您推荐相同类型的内容：

【R去重】保留第一个重复去所有的重复