r语言如何添加一列变量

Python08

r语言如何添加一列变量,第1张

已知数据集a1,有N行变量新建数据集a2,b为列名a1=data.frame(b=c('a','b','c','d','e'……))输入N个字符型变量或者a1=data.frame(b=c(1,2,3,4,5……))输入N个数值型变量将数据集a1和a2合并为数据集a3a3=data.frame(a1,a2)。注:数据集a1和a2的行数相等,都为N时才能合并。如果不相等,可以用无效值补齐:假设a2只有5行,输入代码a2[6:N,]=NA,就可以补齐为N行,与a1进行合并。

read.xlsx(filename,sheet=1,head=T)

如果你的第一行是数据,head=T会让第一列数据就会被强制为变量名,head=F则相反,这个需要xlsx包。

如果已经载入数据,数据名为a,那么使用colnames(a)=a[1,],就可以把a的行名变成a的第一行数据,然后a=a[-1,],删除第一行数据,就可以了。当然如果需要,也可以保留第一行数据。

扩展资料:

注意事项

header=T表示将文件中第一行设为列名字。row.names= 1表示第一列设为行名。

例如:

data = read.csv("test.csv",row.names= 1) #表示第一行作为列名,第一列作为行名

data = read.csv("test.csv",header=F)  #表示读入没有指定行列名的矩阵数据

因此header=T为默认条件,默认条件下没有行名,如果第一列为行名,则需在读入时指定row.names= 1。

R语言读入表格的函数有:

read.table()

read.csv(

read.csv2()

read.delim()

read.delim2()

其中,读入表格常常要考虑行名和列名的显示方式,例如你读入的表格第一行是否为各列的列名,第一列是否为各行的行名等等。

我有一个TCGA的表达谱文件,用Excel打开长这样:

我满心欢喜的想要获取TCGA-AB-2949-03B列的表达值:

结果返回的却是 NULL ,查看 e 的列名才发现,TCGA-AB-2949-03B列的列名根本不是TCGA-AB-2949-03B。经过搜索我发现,原来R自动会把列作为一个变量,如果列名不符合R的变量命名规则就会使用 make.names 方法转换:

返回:

那如何禁用这种行为呢:

返回: