d1 <- do.call(cbind, lapply(lapply(d, unlist), length<- , max(lengths(d))))
lapply(x,fun),lapply接收两个值,x为向量或列表,fun是方法,这个函数的意思是将fun方法作用到x的每个元素,返回一个与x相同长度的列表
unlist函数接收一个列表,unlist将其简化为一个包含列表中所有原子成分的向量
外面嵌套的那层lapply函数,是将每个向量元素的长度设定为最长的那个长度,缺失值用NA补齐
cbind是按列合并向量,如果两列数量不一样会自动重复短的那列
do.call函数与lapply函数功能类似,但有一点不一样
lapply()为列表中的每个元素应用一个给定的函数,所以会有几个函数调用。
do.call()将给定的函数作为一个整体应用于列表,所以只有一个函数调用。
详细差别见 http://www.dovov.com/rlapplydo-call.html
merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(".x",".y"), incomparables = NULL, ...)
x,y:用于合并的两个数据框
by,by.x,by.y:用于连接两个数据集的列,intersect(a,b)值向量a,b的交集,names(x)指提取数据集x的列名 by = intersect(names(x), names(y)) 是获取数据集x,y的列名后,提取其公共列名,作为两个数据集的连接列, 当有多个公共列时,需用下标指出公共列,如names(x)[1],指定x数据集的第1列作为公共列 也可以直接写为 by = ‘公共列名’ ,前提是两个数据集中都有该列名,并且大小写完全一致,R语言区分大小写
all,all.x,all.y:指定x和y的行是否应该全在输出文件.
sort:by指定的列是否要排序.
suffixes:指定除by外相同列名的后缀.
incomparables:指定by中哪些单元不进行合并.
merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式。all=T代表全连接,all.x=T代表左联结;all.y=T代表右连接
inner 模式匹配,只显示两个数据集公共列中均有的行
outer 模式,将两张表的数据汇总,表中原来没有的数据置为空
left 匹配模式
right 匹配模式