R语言取两列的交集

Python014

R语言取两列的交集,第1张

杀杀

得到结果是4和5都在两个矩阵中出现。

此时intersect是不能适用的。

接着使用函数

就能得到交集啦~

祝大家521快乐哟~

韦恩(Venn)图是常见统计图之一,用于展示各样本(或分组)之间共有(或特有)元素的数量(或比例)。

例如做RNA-seq的最直接目的,大多是鉴定差异表达的基因。当试验涉及到多分组情况时,常需要展示多组间共享的差异基因数量,这个时候就要使用到韦恩Venn图。例如以下示例,植物组织中响应7天氮缺乏(-N_7d)、7天磷酸盐缺乏(-Pi_7d)和盐胁迫(d)、冷胁迫(e)或干旱胁迫(f)的差异表达lncRNA的Venn图。

文献中通常提到,这些Venn图一般通过一些R包(如VennDiagram)来做。

本篇教程,就让我带您学习如何使用R包VennDiagram绘制Venn图,以及如何统计各组元素的交集。

首先准备输入数据。既然期望比较各组共有/特有元素,那么就可以将各组中所包含的元素提取出来,粘贴到一个新的列表中。

如下图示例,一共包含4个分组,group1-4,下方是各组中所包含的元素名称。各列不等长没关系,某一列内有重复的值也没关系,后续读到R中后能够自动识别并去除空值或重复值。

接下来,将该文件读到R中,绘制Venn图。

VennDiagram包中的函数venn.diagram(),可以直接基于原始数据自动统计并绘制Venn图。

工作路径下输出一张图片“venn2.png”,打开就是绘制的Venn图。

这是展示的两组的,再展示一个四组比较的。

同样地,工作路径下输出一张图片“venn4.png”,打开就是绘制的Venn图。

以上自动读取原始数据,并统计各组之间的交集状态,获取共有元素的数量信息后,绘制Venn图,整个过程一气呵成。

但是,如果期望获得各组之间的交集元素具体包含哪些,并将这些交集元素的名称输出出来,应该怎样做呢?

VennDiagram包中的函数get.venn.partitions()可以实现这个功能,参考以下示例。

工作路径下输出文件“venn4_inter.txt”,可以用Excel打开。

group1-4中,TRUE代表该组中出现的元素,FALSE则代表未出现的元素。

count为交集元素数量,values为交集元素名称。

这个叫heatmap.library(gplots)里有个函数叫heatmap.2专门画这种图。但你这张不是标准的heatmap,要调整边框大小单元大小,不对行和列作聚类分析,颜色也得改。