R语言使用技巧
当你要对按照数据框某一列的信息对文件进行分组时
1. 可以使用split函数
2. 可以使用group_by() 函数,但是这个函数不能方便你接下来对每个小的group进行更为复杂的操作。
3. group_split() 函数
4. group_nest() 函数以及nest()函数
具体参数可参考:
https://www.jianshu.com/p/2efbf6632dc6
group_list()可以把大的数据框按照某一列切分为小的数据框,这些小的数据框再组成一个list
参考: https://mp.weixin.qq.com/s/XGb3P6SY2UlZMgun_etFmg
nest()函数可以创建嵌套数据框,将多列多行组成一个列表,而这个列表单独成为一列,称为列表列。
nest() 函数有两种使用方式。当用于分组数据框时,nest() 函数会保留用于分组的列,而将其他所有数据归并到列表列中。
还可以在未分组数据框上使用nest(),此时需要指定嵌套哪些列。
使用这些函数时,要清楚输入输出的格式是什么,怎么样取值才能得到想要的格式,是使用appply还是lapply,以及map要根据实际情况来定。
read.xlsx(filename,sheet=1,head=T)
如果你的第一行是数据,head=T会让第一列数据就会被强制为变量名,head=F则相反,这个需要xlsx包。
如果已经载入数据,数据名为a,那么使用colnames(a)=a[1,],就可以把a的行名变成a的第一行数据,然后a=a[-1,],删除第一行数据,就可以了。当然如果需要,也可以保留第一行数据。
扩展资料:注意事项
header=T表示将文件中第一行设为列名字。row.names= 1表示第一列设为行名。
例如:
data = read.csv("test.csv",row.names= 1) #表示第一行作为列名,第一列作为行名
data = read.csv("test.csv",header=F) #表示读入没有指定行列名的矩阵数据
因此header=T为默认条件,默认条件下没有行名,如果第一列为行名,则需在读入时指定row.names= 1。
R语言读入表格的函数有:
read.table()
read.csv(
read.csv2()
read.delim()
read.delim2()
其中,读入表格常常要考虑行名和列名的显示方式,例如你读入的表格第一行是否为各列的列名,第一列是否为各行的行名等等。