R语言GEO数据挖掘:步骤三:进行基因差异分析

Python017

R语言GEO数据挖掘:步骤三:进行基因差异分析,第1张

用limma包,这里注意,limma包是对基因芯片表达矩阵的分析,不能对逆转录RNAseq表达矩阵进行分析(因为数据特征不同),RNAseq需要用另一种方法

解读此表

但是上面的用法做不到随心所欲的指定任意两组进行比较,所有还有下一种方法

处理好了分组信息,再自定义比较元素

自定义函数进行比较

热土和火山图都是傻瓜式的,只要的前面得出的deg数据(也就是基因差异表达数据)是正确的

有现成的包:matchprobes包 里面有个函数basecontent(seq)计算4中碱基每种的含量;

自己做的话:

#List是你的序列

unlist(strsplit(List,""))->sep.letter#把每个字母都单独分开

#遍历所有字母

count_a=0count_g=0count_t=0count_c=0

for(i in 1:length(sep.letter)){

if(sep.letter[i]=="a"){count_a=count_a+1}

if(sep.letter[i]=="g"){count_g=count_g+1}

.........................

}

更多的美化处理工作可以参考博文《在R中绘制进化树:ggtree学习笔记》。

链接为 http://blog.sciencenet.cn/home.php?mod=space&uid=255662&do=blog&id=969228