【R语言编程】---利用三代测序绘制菌群聚类热图与物种丰度图

Python022

【R语言编程】---利用三代测序绘制菌群聚类热图与物种丰度图,第1张

前言: 仍然是三代测序数据的分析,宏基因组的文章中经常出现聚类热图和物种丰度图,用来直观地识别与某些疾病或者表型相关的菌群构成。

1.读取数据

一共有11个样本,每一个样本的测序reads都经过Nanopore官方的Epi2Me程序鉴定了物种,下表中第一列是被鉴定的菌种,第二列是该样本中每个物种产生的reads数目。

首先导入到R语言中,合并所有样本到一个数据框:

2.绘制热图

经过上一步,我们得到了列名为样本,行名为菌种的reads数据框,然后就可以绘制热图,进行聚类分析了:

绘制结果:

3.绘制物种丰度图

丰度图,其实就是堆积图,把每个样本的reads数目转换为百分数,然后作图就可以了:

绘制结果:

前言:接上一篇,很多文献中为了更直观的展示一个微环境中的菌群分布,常常将样本聚类与物种丰度同时展示。

1.数据结构

首先需要准备丰度数据表Abundance.txt和分组信息group.txt

丰度数据以样本为列名,以菌种为行名:

分组信息以列出了每个样本属于病例/对照组:

3.再画丰度图

丰度图其实就是堆叠图:

4.结果展示

分析思路

1 merge获得总细菌信息,结合样品数信息,制作细菌样品矩阵/表,0填充

2 利用循环统计每对配对样品的细菌呈现情况(是否贡献),丰度都大于0的细菌记为1,否则仍是0

3 获得总细菌样品呈现表,统计每个细菌的总共现次数

4 对前10绘制柱形图

参考:

Discordant transmission of bacteria and viruses from mothers to babies at birth. Microbiome 2019