对了,我看到有一个Lao People's什么的国家,单词中间是用空格隔开的,直接read.table要出问题(因为read.table的分隔符默认是空格),这种应该还是要你自己手动处理一下。
(2)我觉得标准的数据都是每一排是一个observation,每一列是一个variable,不会像这样的。不止是R,SAS也是这样的。
PS:墙裂推荐你装一个RStudio,每次用R都直接用RStudio,界面和R比提升不止一个档次。
读入数据的时候遇到行名有重复而报错的情况,如下图
mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, row.names=1, check.names = F)
报错:Error in read.table("data_RNA_Seq_v2_mRNA_median _Zscores.txt", header = T, : 'row.names'里不能有重复的名字
此时可以使用base包中的make.names()函数
使用方法:
1.先不设置行名将数据读进去
mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, check.names = F)
2.使用make.names函数将第一列作为行名
row.names(mydata<-make.names(mydata[,1],TRUE)
关于make.names函数的使用方法可以通过?make.names获得
3. 删除第一列
mydata<-mydata[,-1]
4.查看数据前五行前五列看是否行名修改完成
mydata[1:5,1:5]