R语言如何做多次重复的统计分析,求教

Python019

R语言如何做多次重复的统计分析,求教,第1张

duplicated() 找出重复出现的元素。给出一例子

>test<-c(21,22,22,23,22,23,24)

>duplicated(test)

[1] FALSE FALSE TRUE FALSE TRUE TRUE FALSE

看得出duplicated()给出的是判断坐标:首次出现的22,函数给的值是F,但再次出现就成T了。

>indicator<-duplicated(test)

>table(test[indicator])

22 23

2 1

这是重复出现了几次(不包括首次)

所以你要的加1就行了。

>table(test[indicator])+1

22 23

3 2

读入数据的时候遇到行名有重复而报错的情况,如下图

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, row.names=1, check.names = F)

报错:Error in read.table("data_RNA_Seq_v2_mRNA_median _Zscores.txt", header = T,  :   'row.names'里不能有重复的名字

此时可以使用base包中的make.names()函数

使用方法:

1.先不设置行名将数据读进去

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, check.names = F)

2.使用make.names函数将第一列作为行名

row.names(mydata<-make.names(mydata[,1],TRUE)

关于make.names函数的使用方法可以通过?make.names获得

3. 删除第一列

mydata<-mydata[,-1]

4.查看数据前五行前五列看是否行名修改完成

mydata[1:5,1:5]