查找GSE及对应GPL平台,注释包信息后还能画个热图

Python015

查找GSE及对应GPL平台,注释包信息后还能画个热图,第1张

以前听 GSE号与对应平台GPL号以及注释包 ,总是不知道为什么要互相对应?咋个对应?今天栽了才知道。我没脸写我是怎么栽的,就写写我栽后是如何正确的做完这道题。

我正在做 R语言小作业-中级-第六题 :

解题思路: 上述基因名复制粘贴到一个txt保存为Q6.txt-表达矩阵-注释包得到基因名对应的探针名-过滤表达矩阵-热图

查看过程中我发现这探针名(行名)不是我需要的基因名呀,应该是需要注释包来看探针名和基因名的对应关系

问题来了,我怎么知道这个表达矩阵所需的是 哪个测序平台 ?用的 哪个注释包 做的注释?

看到 Annotation:GPL3921 好了就可以去搜索了

【咋搜索的?在哪里?联网-打开浏览器-bing-输入GPL3921-第一条就是 GEOAccession viewer -打开就看见下图】

参考 https://vip.biotrainee.com/d/761-r-id-symbol

在输出的文件里面可以搜索:

可以看到,有趣的是 ERBB1家族的 ERBB1的正式名字就是大名鼎鼎的EGFR, 而 大名鼎鼎的HER-2 正式名字却是ERBB2

都是 SWI/SNF Related, Matrix Associated, Actin Dependent Regulator Of Chromatin,我是在genecard里面 检查 SMARC发现的

http://www.genecards.org/Search/Keyword?queryString=SMARC

但是大部分文章里面却总是使用它们的别名。

数据框:mRNA; 基因名列:Symbol(在该数据框最后一列);

results = t(sapply(split(mRNA,mRNA$Symbol),function(x) colMeans(x[,1:(ncol(x)-1)])))