R语言绘图包05--韦恩图的绘制:ggvenn和VennDiagram

Python017

R语言绘图包05--韦恩图的绘制:ggvenn和VennDiagram,第1张

R语言绘图包系列:

这个包支持列表或数据框的数据作为输入

1.4.1 美化颜色和大小

颜色填充参数:

fill_color - 默认是 c("blue", "yellow", "green", "red")

fill_alpha - 默认是 0.5

边线设置参数:

stroke_color - 默认是 "black"

stroke_alpha - 默认是 1

stroke_size - 默认是 1

stroke_linetype - 默认是 "solid"

集合名字设置:

set_name_color - 默认是 "black"

set_name_size - 默认是 6

图形中字体设置:

text_color - 默认是 "black"

text_size - 默认是 4

以上所有的参数都可以用于 ggvenn() 和 geom_venn()

1.4.2 展示元素

show_elements - 默认是 FALSE

label_sep - text used to concatenate elements, default is ","

1.4.3 隐藏百分比,改变百分比的小数点位数

show_percentage - 默认是TRUE

digits - 默认是 1

参数:

VennDiagram函数包最大能绘制5个数据集合的韦恩图。

参考:

https://github.com/yanlinlin82/ggvenn

R语言画维恩图--ggvenn

venn.diagram函数文档

The R Graph Gallery绘图教程

https://cloud.tencent.com/developer/article/1675092

https://www.jianshu.com/p/f858521828a5

韦恩图(Venn plot),又称文氏图,是英国的哲学家和数学家约翰·维恩(John Venn)在1881年发明的,主要是用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合(或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。在我们常用的领域,简单来说就是多个集合之间取交集。

绘制韦恩图有很多方式,R,Python,Perl等,这里主要是用R来展示;在R语言中,绘制venn图有很多包可以实现:Venn, Vennplot, VennDiagram, VennDetail, ggvenn,gplots等。

此文主要展示一下用VennDiagram包绘制高纬度的韦恩图。

这样一个简单的GUOFUYASEWANG(国服亚瑟王)的韦恩图就画出来,通过参数给他加点颜色,美观一下。

增加配色之后好看了不少。

除了用R绘制韦恩图,还可以用网站实现。 http://www.interactivenn.net/ 可以绘制2-6维的韦恩图,不需要学会R也能绘制韦恩图。同学们可以自行探索。

有时候自己需要取交集的数据集太多,韦恩图满足不了,可以采用UpSetplot,它可以将交集数目通过柱状图的方式呈现。以UpSetR包里的movies文件做示例:

这是一个3883行,21列的数据集,包含了1995上映的电影具体情况(如Action是否是运动电影,0表示不是运动电影,1表示是运动电影,以此类推)

该图中 黑色 表示该位置有数据, 灰色 的点表示没有, 不同点连线 表示存在 交集 , 不同 柱状图 表示不同的 数目

Hoang的地址: https://www.jianshu.com/u/1fd4ff43abdc

​如何在差异基因Venn图中同时标识上下调基因数量信息

韦恩(Venn)图是常见统计图之一,用于展示各样本(或分组)之间共有(或特有)元素的数量(或比例)。例如做RNA-seq的最直接目的,大多是鉴定差异表达的基因。当试验涉及到多分组情况时,常需要展示多组间共享的差异基因数量,这个时候就要使用到Venn图。例如文献 “Transcriptomic analyses of rice (Oryza sativa) genes and non-coding RNAs under nitrogen starvation using multiple omics technologies” 中,植物组织中响应7天氮缺乏(-N_7d)、7天磷酸盐缺乏(-Pi_7d)和盐胁迫(d)、冷胁迫(e)或干旱胁迫(f)的差异表达lncRNA的Venn图。

不过这种Venn图太过单调,虽然展示了差异基因的数量,却没有区分基因是上调的还是下调的。另一种思路是,分别把上调或下调的基因拿出来,然后分别作图展示上调基因间的交集或者下调基因间的交集,但缺点是如果分组较多的话会很占篇幅,并且如果一个基因在一组中上调而在另一组中下调时则无法绘制出。

为了有效解决这些问题,今天我们来看一种特殊风格的Venn图,能够同时展示基因交集以及上下调数量的二维信息。风格如下, 在Venn图中原数字位置添加了表示上下调基因数量的饼图 。外圈表示不同的分组,饼图则表示了交集/或特有区域中,所包含的上调(红色)和下调(绿色)基因数量。此外,如果交集处某基因在不同组中的上下调趋势不一致,则在灰色区域显示数量。

本节我们来学习如何在R语言中绘制这种特殊的Venn图。

示例数据“treat1_control.txt”、“treat2_control.txt”和“treat3_control.txt”分别为3种不同试验处理下的样品,与对照组相比后识别的显著差异表达基因。表中genes列为差异基因的名称,logFC列中将所有上调基因标识为1,所有下调基因标识为-1。

接下来绘制Venn图展示3组基因的交集概况,并同时将基因的上下调数量信息也表示出来。

使用R包GOplot,即可通过给定的数据绘制这种特殊的Venn图,同时展示基因交集以及上下调数量的二维信息。

这样这种Venn图组合饼图的样式就得到了。

右图Venn图的外圈表示数据中,3组处理组间相同/或特有的差异表达基因数量概况,具体的数值在饼图中展示,红色代表共有的上调基因,绿色代表共有的下调基因,灰色表示交集中在不同组中的上下调趋势不一致的基因。

对于各组交集具体涉及了哪些基因,它们的名称、上下调状态如何,将直接在面板中显示出来,如左图所示列表信息。

总之过程非常方便,很简单的一条命令,您get到了吗?