R语言导入txt列的数目多于列的名字

Python012

R语言导入txt列的数目多于列的名字,第1张

(1)我觉得可以解决吧。你read.table的时候先把第一排忽略掉,然后再处理一下数据,把年份加进来,比如把变量名改成"2003,cases"之类的。

对了,我看到有一个Lao People's什么的国家,单词中间是用空格隔开的,直接read.table要出问题(因为read.table的分隔符默认是空格),这种应该还是要你自己手动处理一下。

(2)我觉得标准的数据都是每一排是一个observation,每一列是一个variable,不会像这样的。不止是R,SAS也是这样的。

PS:墙裂推荐你装一个RStudio,每次用R都直接用RStudio,界面和R比提升不止一个档次。

读入数据的时候遇到行名有重复而报错的情况,如下图

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, row.names=1, check.names = F)

报错:Error in read.table("data_RNA_Seq_v2_mRNA_median _Zscores.txt", header = T,  :   'row.names'里不能有重复的名字

此时可以使用base包中的make.names()函数

使用方法:

1.先不设置行名将数据读进去

mydata<-read.table("data_RNA_Seq_v2_mRNA_median_ Zscores.txt", header = T, check.names = F)

2.使用make.names函数将第一列作为行名

row.names(mydata<-make.names(mydata[,1],TRUE)

关于make.names函数的使用方法可以通过?make.names获得

3. 删除第一列

mydata<-mydata[,-1]

4.查看数据前五行前五列看是否行名修改完成

mydata[1:5,1:5]