R语言GEO数据挖掘:步骤三:进行基因差异分析

Python014

R语言GEO数据挖掘:步骤三:进行基因差异分析,第1张

用limma包,这里注意,limma包是对基因芯片表达矩阵的分析,不能对逆转录RNAseq表达矩阵进行分析(因为数据特征不同),RNAseq需要用另一种方法

解读此表

但是上面的用法做不到随心所欲的指定任意两组进行比较,所有还有下一种方法

处理好了分组信息,再自定义比较元素

自定义函数进行比较

热土和火山图都是傻瓜式的,只要的前面得出的deg数据(也就是基因差异表达数据)是正确的

分析来自5各班的5位中学生的成绩情况,数据必须确保已保存在本地,名称为“scores.txt”

scores <- read.table("scores.txt",header=TRUE, row.names="num") #读取数据,并且默认读取的行名称就是已有的“num”中的数据,读取完成后,可以查看数据的前几行使用以下命令:

head(scores) #回车完成读取

summary(scores) #读取数据的概述

summary(scores$math) #可以获取所有的数学成绩,类似的,还可以获取语文、生物等成绩

child<- scores['573',] #预读取学号为“573”这位同学的全部信息

sum(child) #计算该学生的总成绩

aver <- tapply(chem,class,mean) #计算某班的某一科目的平均成绩

plot(aver,type='b',ylim=c(40,50),main="各班化学成绩平均分",xlab="班级",ylab="化学平均分") #其他成绩也是可以的,其中ylim是纵坐标的最大最小值区间。

subjects <- ('chn','math','eng','phy','chem','bio','politics','history','geo') #获取到所有科目的成绩;

sapply(scores[class==4,subjects],mean) #获取四班所有科目的平均成绩

aggregate (scores[subjects],by=list(class),mean) #按照科目对所有科目进行平均分的计算(每个班只有一组数据,所以结果和原始数据的大小是一样的)

hist(eng) #输出英语成绩的直方图

[1]https://www.cnblogs.com/speeding/p/4107768.html R语言学习笔记:分析学生的考试成绩