GO富集结果整体可视化

2023-03-05 08:09:02Python012

GO富集结果整体可视化,第1张

GO (Gene Ontology )是一个基因功能的国际标准分类体系。意在从分子功能 (Molecular Function)、生物过程 (Biological Process)、和细胞组成 (Cellular Component) 三个层面对基因和蛋白质功能进行限定和描述，建立一个适用于各种物种并能随着研究不断深入而更新的语言词汇标准。

GO富集分析已经算是很常规的分析内容，可以很方便地将分析得到的基因集归类到不同的GO条目，从而让研究者可以轻松地得知这些基因都参与哪些生物过程。GO分析的操作这里就不再赘述了，网上有很多相关的帖子，基本上常规的物种用clusterProfiler包就可以解决了。今天我想来谈谈如何可视化GO分析的结果。对于GO富集结果的可视化，最常见的就是用条形图和气泡图来展示部分关注的条目。

上面两种展现形式最为常见，可以很好地展示关注的条目。我们都知道有时候GO富集的条目会很多，如果想整体预览一下，有没有什么方法可以展示所有条目都涉及哪些功能呢？答案是肯定的。下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

结果如下图：

结果看起来还是有点高大上的感觉，从图中可以看出496个GO条目根据条目名称的语意相似性被分成9个大类，每个大类右边有注释条，标明了每个类中涉及的条目关键字，有点类似词云的感觉。

该包使用起来很简单，虽然不能准确的展示每个GO条目，但可以从整体上概览GO条目都涉及哪些方面，对于后续筛选还是很有帮助的。该包还有更为细节的用法，这里就不再赘述了，感兴趣的可以自己去摸索。按照惯例最后附上官方说明链接： Simplify Functional Enrichment Results 和 Word Cloud Annotation 。

查看GOplot内示例数据的格式，对自己的数据做处理

观察结论：

观察自己的两个数据表：

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成，没有用R中的拼图包

GO是编译性语言，所以函数的顺序是无关紧要的，为了方便阅读，建议入口函数 main 写在最前面，其余函数按照功能需要进行排列

GO的函数 不支持嵌套，重载和默认参数

GO的函数 支持无需声明变量，可变长度，多返回值，匿名，闭包等

GO的函数用 func 来声明，且左大括号 { 不能另起一行

一个简单的示例：

输出为：

参数：可以传0个或多个值来供自己用