GO富集结果整体可视化

Python012

GO富集结果整体可视化,第1张

  GO (Gene Ontology )是一个基因功能的国际标准分类体系。意在从分子功能 (Molecular Function)、生物过程 (Biological Process)、和细胞组成 (Cellular Component) 三个层面对基因和蛋白质功能进行限定和描述,建立一个适用于各种物种并能随着研究不断深入而更新的语言词汇标准。

  GO富集分析已经算是很常规的分析内容,可以很方便地将分析得到的基因集归类到不同的GO条目,从而让研究者可以轻松地得知这些基因都参与哪些生物过程。GO分析的操作这里就不再赘述了,网上有很多相关的帖子,基本上常规的物种用clusterProfiler包就可以解决了。今天我想来谈谈如何可视化GO分析的结果。对于GO富集结果的可视化,最常见的就是用条形图和气泡图来展示部分关注的条目。

  上面两种展现形式最为常见,可以很好地展示关注的条目。我们都知道有时候GO富集的条目会很多,如果想整体预览一下,有没有什么方法可以展示所有条目都涉及哪些功能呢?答案是肯定的。下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。

结果如下图:

  结果看起来还是有点高大上的感觉,从图中可以看出496个GO条目根据条目名称的语意相似性被分成9个大类,每个大类右边有注释条,标明了每个类中涉及的条目关键字,有点类似词云的感觉。

  该包使用起来很简单,虽然不能准确的展示每个GO条目,但可以从整体上概览GO条目都涉及哪些方面,对于后续筛选还是很有帮助的。该包还有更为细节的用法,这里就不再赘述了,感兴趣的可以自己去摸索。按照惯例最后附上官方说明链接: Simplify Functional Enrichment Results 和 Word Cloud Annotation 。

查看GOplot内示例数据的格式,对自己的数据做处理

观察结论:

观察自己的两个数据表:

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成,没有用R中的拼图包

GO是编译性语言,所以函数的顺序是无关紧要的,为了方便阅读,建议入口函数 main 写在最前面,其余函数按照功能需要进行排列

GO的函数 不支持嵌套,重载和默认参数

GO的函数 支持 无需声明变量,可变长度,多返回值,匿名,闭包等

GO的函数用 func 来声明,且左大括号 { 不能另起一行

一个简单的示例:

输出为:

参数:可以传0个或多个值来供自己用

返回:通过用 return 来进行返回

输出为:

上面就是一个典型的多参数传递与多返回值

对例子的说明:

按值传递:是对某个变量进行复制,不能更改原变量的值

引用传递:相当于按指针传递,可以同时改变原来的值,并且消耗的内存会更少,只有4或8个字节的消耗

在上例中,返回值 (d int, e int, f int) { 是进行了命名,如果不想命名可以写成 (int,int,int){ ,返回的结果都是一样的,但要注意:

当返回了多个值,我们某些变量不想要,或实际用不到,我们可以使用 _ 来补位,例如上例的返回我们可以写成 d,_,f := test(a,b,c) ,我们不想要中间的返回值,可以以这种形式来舍弃掉

在参数后面以 变量 ... type 这种形式的,我们就要以判断出这是一个可变长度的参数

输出为:

在上例中, strs ...string 中, strs 的实际值是b,c,d,e,这就是一个最简单的传递可变长度的参数的例子,更多一些演变的形式,都非常类似

在GO中 defer 关键字非常重要,相当于面相对像中的析构函数,也就是在某个函数执行完成后,GO会自动这个;

如果在多层循环中函数里,都定义了 defer ,那么它的执行顺序是先进后出;

当某个函数出现严重错误时, defer 也会被调用

输出为

这是一个最简单的测试了,当然还有更复杂的调用,比如调试程序时,判断是哪个函数出了问题,完全可以根据 defer 打印出来的内容来进行判断,非常快速,这种留给你们去实现

一个函数在函数体内自己调用自己我们称之为递归函数,在做递归调用时,经常会将内存给占满,这是非常要注意的,常用的比如,快速排序就是用的递归调用

本篇重点介绍了GO函数(func)的声明与使用,下一篇将介绍GO的结构 struct