R语言-均值合并多个探针对应一个基因

Python014

R语言-均值合并多个探针对应一个基因,第1张

数据框:mRNA; 基因名列:Symbol(在该数据框最后一列);

results = t(sapply(split(mRNA,mRNA$Symbol),function(x) colMeans(x[,1:(ncol(x)-1)])))

 "不考虑基因,每一个探针当作一个单独的个体",比较常用。针对“9种treatments,每个treatment有3只老鼠”的实验应该是首选。多个探针实际上数据结果基本上是一致的,如果有很大的偏差一般是由于基因3‘-UTR可变剪切造成的,舍去即可。如果差异基因列表中出现两个以上探针指向同一个基因,取绝对值较大者。若相近取其一或平均都行。