【R去重】保留第一个重复去所有的重复

2023-02-23 08:15:02Python010

【R去重】保留第一个重复去所有的重复,第1张

R语言第二章数据处理③删除重复数据

果子学生信

1.保留第一个重复: A,A,B,C --->A,B,C

2.去掉所有重复:A,A,B,C --->B,C

一般情况函数默认都是保留第一个重复。

比如：

在R中识别和删除重复数据：

主要运用 dplyr::n()

do包中的duplicate()命令和duplicated()命令的主要区别是前者包含了所有重复项，后者不包含重复的第一项。

duplicate()命令在开发版的do包中，CRAN上的do包并不包含这一命令。

安装方法是devtools:install_github("yikeshu0611/do")

去掉所有重复最简洁函数： df %>% group_by(a) %>% filter(n()==1)

读入数据的时候遇到行名有重复而报错的情况，如下图

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, row.names=1, check.names = F)

报错：Error in read.table("data_RNA_Seq_v2_mRNA_median _Zscores.txt", header = T, : 'row.names'里不能有重复的名字

此时可以使用base包中的make.names()函数

使用方法：

1.先不设置行名将数据读进去

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, check.names = F)

2.使用make.names函数将第一列作为行名

row.names(mydata<-make.names(mydata[,1],TRUE)

关于make.names函数的使用方法可以通过？make.names获得

3. 删除第一列

mydata<-mydata[,-1]

4.查看数据前五行前五列看是否行名修改完成

mydata[1:5,1:5]

那你就先把所有的字符串都变成小写，再用duplicated比较就好了

x<-c("Anne","anne","bkk")

y<-tolower(x)

duplicated(y)

函数第一个数据命令有的

# 上一篇：golang工程师面试之生辰八字

# 下一篇：ruby老师什么意思

给您推荐相同类型的内容：

java中date的获取以及使用
1、使用new Date()获取当前日期，new Date().getTime()获取当前毫秒数2、计算公式，等于获取的当前日期减去或者加上一天的毫秒数。一天的毫秒数的计算公式：24小时*60分钟*60秒*1000毫秒，也是8640000
MAC电脑安装cocoapods ruby 2.6.0 权限问题
报这个ERROR: While executing gem ... (Gem::FilePermissionError) You don't have write permissions for the LibraryRu
R语言怎么提取“1,2,5,6,10,11”即一串字符串中的数字
1、定义一个常量，bd&lt-c("a","b","c")。2、计算字符串的数量函数，nchar()。3、字符串提取函数substr()。4、向量中的搜索函数grep()。
python怎么进入编程界面
python怎么进入编程界面。电脑中打开python编辑器之后，代码少的情况下可以直接编程，代码多的情况下新建窗口后进行编程即可。在电脑搜索框中输入python进行搜索，在搜索结果中打开python编辑器。如果代码很少，比如只有一行的，可以
r语言中矩阵特征值出现复数如何取最大
特征向量的几何意义特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一
python pip安装不了模块？
看看你的pip旁边是否有pip3，如果有，换成pip3试试python默认安装路径应该不是d:program filespython（可能涉及到空格等问题），最好卸载重装，让它安到默认位置python实现跨文件全局变量的方法在使用Pyt
初夏电子书txt全集下载
《初夏》百度网盘txt 最新全集下载；链接: https:pan.baidu.coms1-PXt6vTuIyNJYxtE7k_VLA提取码：y6mm 《初夏》是首本夏达个人画集，其中收录了逾百张夏达代表级插画佳作，以及大量未公
C语言程序，关于银行排队的。在线等！
#include&ltstdio.h&gt#include&ltmalloc.h&gt#define N 10int main(void){int i,j,x,m,flag=1char chm=Nch
C语言要求编写一个简单计算器的程序
方法一：#include &ltstdio.h&gt#include&ltstring.h&gt#include&ltmath.h&gt#include&ltstdlib.h&
现在的java培训大概的费用一般都是多少钱？
现在大部分java培训的线下班费用是在20000~30000之间不等。具体多少钱还是要根据所处城市，所学机构实际咨询了解的价格为准。因为不同城市、不同机构之间师资、课程和学习环境各方面都有所不同，所以培训费用也会存在一定的差别。千锋教育有线
为什么要学 Python
① 简单易学Python语言相对于其他编程语言来说，属于比较容易学习的一门编程语言。开发语言在大数据里面是必不可少的，而简单易学，上手快的Python语言，将作为大数据的首选语言。② 语法优美Python语言力求代码简洁、优美，在Py
Python之re模块
re模块是python独有的匹配字符串的模块，该模块中提供的很多功能是基于正则表达式实现的，而正则表达式是对字符串进行模糊匹配，提取自己需要的字符串部分，他对所有的语言都通用。1、字符 2、字符集 3、量词
python异步有哪些方式
yield相当于return，他将相应的值返回给调用next()或者send()的调用者，从而交出了CPU使用权，而当调用者再次调用next()或者send()的时候，又会返回到yield中断的地方，如果send有参数，还会将参数返回给yi
JAVA通过数组按首字母排序怎么做？
自己封装的一个工具类,可以将汉字按照拼音的首字母排序,支持对Model和字典排序.只能对首字母排序,不支持第二个字母，实现的原理就是创建一个A-Z的数组,数组中的元素是字典,字典中有两个元素,一个是title,就是当前的首字母 A-Z中的
当下对于量化投资有用的R语言包有哪些
quantmod包是用于帮助量化投资者开发、测试和部署基于统计的交易模型的软件系统。它是一个快速原型环境，量化投资者（宽客）可以快速和干净地对交易模型进行构建和探索；但是，quantmod并不试图替代任何统计软件，也没有什么新的“建模”过程
rubyvalley是什么酒
NV年马丽塔瓦拉宝石红波特酒，全称NV Maritavora Ruby Porto, Douro Valley, Portugal._饪畈ㄌ鼐圃谙鹉就爸惺旎泄车南阄叮梢缘ザ酪茫部梢源钆淠汤液吞鸬恪?对于选择一款合适的笔记本这个问题来讲困扰着
C语言中如何改变字体大小和颜色？
1、在主界面的菜单栏找到工具菜单(tool)，打开tools。2、在tools菜单当中，选择options，打开，3、下面就是设置字体和字号了。点击向右的箭头，找到font。4、打开font，根据自己的爱好选择合适自己的字体。5、先选择字体
Java程序员需要掌握的云计算知识？
随着互联网的不断发展，云计算在互联网中得到了广泛的使用。云计算在编程开发中有什么意义呢？对于Java开发程序员来说，云计算的知识掌握也是非常关键的，那么Java程序员需要掌握哪些云计算知识呢？下面电脑培训为大家具体介绍。在日常开发中，Jav
go语言适合做什么
Go语言主要用作服务器端开发。其定位是用来开发“大型软件”的，适合于需要很多程序员一起开发，并且开发周期较长的大型软件和支持云计算的网络服务。Go语言融合了传统编译型语言的高效性和脚本语言的易用性和富于表达性，不仅提高了项目的开发速度，而
java中的Date是怎么使用的？
1、代码：System.out.println(new java.util.Date())输出：Thu Jan 27 14:43:28 CST 20112、代码：System.out.println(new java.util.Date
刘德华主演的叫祥弟的电影
《龙在江湖》。《龙在江湖》是由香港永盛电影公司发行的动作片，由王晶执导，刘德华、梁咏琪、关秀媚领衔主演。影片于1998年7月1日在香港上映。该片讲述了进入黑社会的韦吉祥命运坎坷，妻子意外去世，与儿子韦大洪关系摩擦不断的故事。剧情简介
北大青鸟设计培训：Java软件开发是干什么的？
Java作为软件开发大型项目中的主角，当下不少朋友都在学Java软件开发，他们期待自己在软件开发行业中有所作为。Java软件开发学习的人数是越发的多，但是很多朋友是冲着Java软件开发良好的发展前景学的，并不是很清楚Java软件开发是干什么
go语言开发过什么产品
go目前开发的大型产品还很少。目前我所知道的有：beego，国内开发者开发的web框架SudoChina,golang 开发的CMSMonsti 也是一个CMS其他的都在GIT上有一些开源项目。毕竟很年轻的语言，大型成熟的产品还很少。不过我
R语言-方差检验
对实验数据检验方差相等的正态分布总体均值是否相等。判断各因素对试验指标影响是否显著。根据影响实验指标条件的个数可以区分为：单因素方差分析，双因素方差分析，多因素方差分析 boxplot（目标变量~变量，data=数据框）箱子中的黑
有部历险电影叫什么away
找找这里有没有你想要的电影：为子搬迁 Away We Go(2009) 一次完美的逃亡 A Perfect Getaway(2009) 你的列车牵我心 Your Trains Takes My Heart Away(2008) 单车上路 R
C语言编写一个用户登陆的程序？
代码如下：#include&ltstdio.h&gt#pragma warning(disable:4996)#include&ltstring.h&gtint main(){int i = 0
c语言文件读写“追加”
通过一个简单的示例进行讲解（此示例用文本文件进行演示）：#include &ltstdio.h&gt#include &ltstdlib.h&gt#include &lterrno.h&
unsigned在c语言中是什么意思？
无符号数的意思。整型的每一种都有无符号（unsigned）和有符号（signed）两种类型（float和double总是带符号的）在默认情况下声明的整型变量都是有符号的类型（char有点特别），如果需声明无符号类型的话就需要在类型前加上
Golang kafka简述和操作（sarama同步异步和消费组）
一、Kafka简述 1. 为什么需要用到消息队列异步：对比以前的串行同步方式来说，可以在同一时间做更多的事情，提高效率；解耦：在耦合太高的场景，多个任务要对同一个数据进行操作消费的时候，会导致一个任务的处理因为另一个任务对数
Python中如何清屏
本文实例讲述了python实现清屏的方法。分享给大家供大家参考。具体分析如下：2&gt&gt&gtimport os &gt&gt&gtos.system('cls')

推荐阅读

热门文章

最新发布

标签列表

【R去重】 保留第一个重复去所有的重复

给您推荐相同类型的内容：

【R去重】保留第一个重复去所有的重复