【R语言编程】---绘制带聚类树的丰度图(代码示例)

Python017

【R语言编程】---绘制带聚类树的丰度图(代码示例),第1张

前言:接上一篇,很多文献中为了更直观的展示一个微环境中的菌群分布,常常将样本聚类与物种丰度同时展示。

1.数据结构

首先需要准备丰度数据表Abundance.txt和分组信息group.txt

丰度数据以样本为列名,以菌种为行名:

分组信息以列出了每个样本属于病例/对照组:

3.再画丰度图

丰度图其实就是堆叠图:

4.结果展示

前言: 仍然是三代测序数据的分析,宏基因组的文章中经常出现聚类热图和物种丰度图,用来直观地识别与某些疾病或者表型相关的菌群构成。

1.读取数据

一共有11个样本,每一个样本的测序reads都经过Nanopore官方的Epi2Me程序鉴定了物种,下表中第一列是被鉴定的菌种,第二列是该样本中每个物种产生的reads数目。

首先导入到R语言中,合并所有样本到一个数据框:

2.绘制热图

经过上一步,我们得到了列名为样本,行名为菌种的reads数据框,然后就可以绘制热图,进行聚类分析了:

绘制结果:

3.绘制物种丰度图

丰度图,其实就是堆积图,把每个样本的reads数目转换为百分数,然后作图就可以了:

绘制结果:

qiime2会直接给出各个分类水平的丰度表,用R语言也可以从otu表中抽提出各个水平的丰度表。

读取otu丰富度

代码思路:

1 strsplit后,phylum不是na也不是""则记下,否则记行数到delete

2 添加phylum列,删除注释列和记到delete的phylum

3 按Phylum排序,获取Phylum unique列表

4提取第一个phylum所有行到新表,apply列求和

5遍历剩下的phylum列表,提取每个phylum,apply按列求和,添加到新表

6 数据归一化,保存

拓展:

R语言读取Excel文件的各种方法

最近初学R语言,在R语言读入EXCEL数据格式文件的问题上遇到了困难,经过在网上搜索解决了这一问题,下面归纳几种方法,供大家分享:

第一: R中读取excel文件中的数据的路径:

假定在您的电脑有一个 excel 文件,原始的文件路径是: D:workdata1

如果直接把这个路径拷贝到R中,就会出现错误,原因是:

是escape character(转义符),\才是真正的字符,或者用/

因此,在R中有两种方法读取该路径:

1:在R中输入一下路径: D:\work\data\1 2:在R中输入一下路径: D:\work\data\1 第二: R中读取excel文件中的数据的方法 :

read.table(),read.csv(),read.delim()直接读取EXCEl文件时,都会遇到一下问题:“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有以下几种:假如文件1.1中是一个6乘以2的矩阵,元素为:

方法1: xls另存为csv格式然后用read.csv :

具体过程如下:

>data<-read.csv("D:\work\data\1.csv") >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data<-read.csv("D:\work\data\1.csv",header = F) >data V1 V2 1 1 23333 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 >data<-read.csv("D:\work\data\1.csv",header = T) >data X1 X23333 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 也就是说 header = T(TURE)是默认的状态 ,在这默认状态下,输出的data矩阵是一个5乘以2的矩阵,第一行作为了data的名字,如果 header = F(FALSE), 则会现实原始的矩阵结果。

方法2: xls另存为txt格式然后用read.table : 如例子所示:

>data<-read.table("D:\work\data\1.txt",header = T) >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28

>data<-read.table("D:\work\data\1.txt",header = F) >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 方法3:打开EXCEL,全选里面的内容,点击复制,然后在R中输入一下命令:数据分析培训

data <- read.table("clipboard", header = T, sep = 't') 结果如下所示:

>data <- read.table("clipboard", header = T, sep = 't') >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data <- read.table("clipboard", header = F, sep = 't') >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 使用这种方法的时候一定要注意复制!剪切板里面没有内容是无法运行的!