#1. 检查是否有缺失值
which(is.na(mRNA),arr.ind = T)
#2. 计算行均值并填充
#该数据中探针(基因)为行(名),样本为列(名),(数据框内容为表达量数据值型数据数据)格式可见文章最后
row_mean <- apply(mRNA,1,mean,na.rm =T) #1是行,2是列,若用其他方法修改mean即可
mRNA$MEAN <- row_mean
ncol = 样本数
for (i in 1:nrow(mRNA)) {
mRNA[i,is.na(mRNA[i,])] <- mRNA[i,ncol]
}
用limma包,这里注意,limma包是对基因芯片表达矩阵的分析,不能对逆转录RNAseq表达矩阵进行分析(因为数据特征不同),RNAseq需要用另一种方法
解读此表
但是上面的用法做不到随心所欲的指定任意两组进行比较,所有还有下一种方法
处理好了分组信息,再自定义比较元素
自定义函数进行比较
热土和火山图都是傻瓜式的,只要的前面得出的deg数据(也就是基因差异表达数据)是正确的