【R语言编程】---绘制带聚类树的丰度图（代码示例）

2023-02-24 13:58:02Python017

【R语言编程】---绘制带聚类树的丰度图（代码示例）,第1张

前言：接上一篇，很多文献中为了更直观的展示一个微环境中的菌群分布，常常将样本聚类与物种丰度同时展示。

1.数据结构

首先需要准备丰度数据表Abundance.txt和分组信息group.txt

丰度数据以样本为列名，以菌种为行名：

分组信息以列出了每个样本属于病例/对照组：

3.再画丰度图

丰度图其实就是堆叠图：

4.结果展示

前言： 仍然是三代测序数据的分析，宏基因组的文章中经常出现聚类热图和物种丰度图，用来直观地识别与某些疾病或者表型相关的菌群构成。

1.读取数据

一共有11个样本，每一个样本的测序reads都经过Nanopore官方的Epi2Me程序鉴定了物种，下表中第一列是被鉴定的菌种，第二列是该样本中每个物种产生的reads数目。

首先导入到R语言中，合并所有样本到一个数据框：

2.绘制热图

经过上一步，我们得到了列名为样本，行名为菌种的reads数据框，然后就可以绘制热图，进行聚类分析了：

绘制结果：

3.绘制物种丰度图

丰度图，其实就是堆积图，把每个样本的reads数目转换为百分数，然后作图就可以了：

绘制结果：

qiime2会直接给出各个分类水平的丰度表，用R语言也可以从otu表中抽提出各个水平的丰度表。

读取otu丰富度

代码思路：

1 strsplit后，phylum不是na也不是""则记下，否则记行数到delete

2 添加phylum列，删除注释列和记到delete的phylum

3 按Phylum排序，获取Phylum unique列表

4提取第一个phylum所有行到新表，apply列求和

5遍历剩下的phylum列表，提取每个phylum，apply按列求和，添加到新表

6 数据归一化，保存

拓展:

R语言读取Excel文件的各种方法

最近初学R语言，在R语言读入EXCEL数据格式文件的问题上遇到了困难，经过在网上搜索解决了这一问题，下面归纳几种方法，供大家分享：

第一： R中读取excel文件中的数据的路径：

假定在您的电脑有一个 excel 文件，原始的文件路径是： D:workdata1

如果直接把这个路径拷贝到R中，就会出现错误，原因是：

是escape character（转义符），\才是真正的字符，或者用/

因此，在R中有两种方法读取该路径：

1：在R中输入一下路径： D:\work\data\1 2：在R中输入一下路径： D:\work\data\1 第二： R中读取excel文件中的数据的方法：

read.table(),read.csv(),read.delim()直接读取EXCEl文件时，都会遇到一下问题：“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有以下几种：假如文件1.1中是一个6乘以2的矩阵，元素为：

方法1： xls另存为csv格式然后用read.csv ：

具体过程如下：

>data<-read.csv("D:\work\data\1.csv") >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data<-read.csv("D:\work\data\1.csv",header = F) >data V1 V2 1 1 23333 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 >data<-read.csv("D:\work\data\1.csv",header = T) >data X1 X23333 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 也就是说 header = T（TURE）是默认的状态，在这默认状态下，输出的data矩阵是一个5乘以2的矩阵，第一行作为了data的名字，如果 header = F（FALSE），则会现实原始的矩阵结果。

方法2： xls另存为txt格式然后用read.table ：如例子所示：

>data<-read.table("D:\work\data\1.txt",header = T) >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28

>data<-read.table("D:\work\data\1.txt",header = F) >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 方法3：打开EXCEL，全选里面的内容，点击复制，然后在R中输入一下命令：数据分析培训

data <- read.table("clipboard", header = T, sep = 't') 结果如下所示：

>data <- read.table("clipboard", header = T, sep = 't') >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data <- read.table("clipboard", header = F, sep = 't') >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 使用这种方法的时候一定要注意复制！剪切板里面没有内容是无法运行的！

样本数据物种路径文件

# 上一篇：r语言怎么读取txt文件

# 下一篇：《Go语言程序设计》epub下载在线阅读，求百度网盘云资源