【R语言】解决GO富集分析绘图,标签重叠问题

Python019

【R语言】解决GO富集分析绘图,标签重叠问题,第1张

前面我给大家详细介绍过

☞GO简介及GO富集结果解读

☞四种GO富集柱形图、气泡图解读

☞GO富集分析四种风格展示结果—柱形图,气泡图

☞KEGG富集分析—柱形图,气泡图,通路图

☞ DAVID GO和KEGG富集分析及结果可视化

也用视频给大家介绍过

☞ GO和KEGG富集分析视频讲解

最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了。

气泡图

柱形图

这个图别说美观了,简直不忍直视。经过我的认真研究,发现跟R版本有关。前面我给大家展示的基本都是R 3.6.3做出来的图。很多粉丝可能用的都是最新版本的R 4.1.2。

我们知道R的版本在不停的更新,相应的R包也在不停的更新。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在。

dotplot这个函数,多了个 label_format 参数

我们来看看这个参数究竟是干什么用的,看看参数说明

label_format :

a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters

原来这个参数默认值是30,当标签的长度大于30个字符就会被折叠,用多行来展示。既然问题找到了,我们就来调节一下这个参数,把他设置成100,让我们的标签可以一行展示。

是不是还是原来的配方,还是熟悉的味道

同样的柱形图,我们也能让他恢复原来的容貌。

关于如何使用R做GO和KEGG富集分析,可参考下文

GO和KEGG富集分析视频讲解

查看GOplot内示例数据的格式,对自己的数据做处理

观察结论:

观察自己的两个数据表:

table.legend 设置为T时会显示表格

本图中表格和图例是出图后剪切拼合而成,没有用R中的拼图包

“差异基因kegg注释图”是转录组分析结果的重要组成部分,能够帮助大家了解差异基因分属于哪些代谢通路,文章中如果能够插入下面这类图来说明样品间的差异,一定会为你的文章增色不少。

下面给大家介绍一下如何在Windows下对差异基因进行kegg注释。

一、输入数据准备:

首先要准备的是各比较组(比如CK1比上Treat1)的差异基因列表,一般公司做完的标准分析结果里已经包含这部分内容了,通常在“DEG_Analysis”文件夹里,我们用到的信息是“ 基因ID ”和“ regulated ”(up代表上调,down代表下调)两列,如下图所示的第一列和最后一列:

接下来需要添加一列,将“regulated”里的“up”标记成“red”,“down”标记成“green”,这样后面做出来的kegg注释图里上调基因就会显示为红色,下调基因显示为绿色。具体方法是在第三列插入一个“ if ”函数,当第二列值为“up”时输出“red”,否则输出“green”,参数设置详见下图:

这样C2单元格就会显示为“red”,双击该单元格右下角,这样C列就都按上面的规则填充好了,如下图所示:

二、在作图网站填入数据:

打开网站:https://www.genome.jp/kegg/tool/map_pathway2.html

按照下方设置好参数,并将第一步准备好的Excel表里的第一和第三列数据粘贴进去(注意:Excel表的 第一行 和 第二列 都不用粘贴),点击左下角的“exec”按钮开始运算。根据您提交的基因数量,等待一小段时间结果就出来了:

注释到的代谢通路结果,按数量排序:

点击其中的代谢通路链接,就能够看出该代谢通路中哪些基因上调、哪些基因下调了。

好的,这样差异基因的kegg注释就完成了。掌握之后,便可在几分钟之内做任意差异基因列表的kegg注释图而不用找公司了!

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接: 基因家族分析实操课程 、 基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接: 转录组(有参)结果解读 ; 转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接: WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接: 转录组标准分析后的数据挖掘 、 转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读 、 OTU网络图绘制 、 cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课,学习链接: linux系统使用 、 perl入门到精通 、 perl语言高级 、 R语言画图

7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接: TCGA-差异基因分析 、 GEO芯片数据挖掘 、 GSEA富集分析课程 、 TCGA临床数据生存分析 、 TCGA-转录因子分析 、 TCGA-ceRNA调控网络分析

8.其他课程链接: 二代测序转录组数据自主分析 、 NCBI数据上传 、 二代测序数据解读 。