R语言|绘制NMDS图

2023-02-22 02:19:01Python011

R语言|绘制NMDS图,第1张

非度量多维标度（NMDS）分析

非度量多维标度（Non-metric Multidimensional Scaling，NMDS）是一种将多维空间的研究对象（样本或变量）简化到低维空间进行定位、分析和归类，同时又保留对象间原始关系的数据分析方法。

与PCoA相似，NMDS都使用样本相似性距离矩阵进行降维排序分析，但NMDS侧重反映距离矩阵中数值的排序关系，NMDS图形常用作微生物群落研究的β分析。

来看看R的vegan包和ggplot2包是如何绘制NMDS图的。

使用数据文件如下：

①otu_table.txt

②group.txt

方法如下：

1.调用vegan包metaMDS()函数执行NMDS，读取数据；

2.根据物种组成计算样方距离，如 Bray-curtis 距离；

3.NMDS 排序，定义 2 个维度；

4.提取应力函数值、样方得分，查看主要结果；

5.物种变量可通过丰度加权平方被动添加至排序图中；

6.使用ggplot2包作图。

聚类分析有两种主要计算方法，分别是凝聚层次聚类（Agglomerative hierarchical method）和K均值聚类（K-Means）。

层次聚类又称为系统聚类，首先要定义样本之间的距离关系，距离较近的归为一类，较远的则属于不同的类。可用于定义“距离”的统计量包括了欧氏距离 (euclidean)、马氏距离(manhattan)、两项距离(binary)、明氏距离(minkowski)。还包括相关系数和夹角余弦。层次聚类首先将每个样本单独作为一类，然后将不同类之间距离最近的进行合并，合并后重新计算类间距离。这个过程一直持续到将所有样本归为一类为止。在计算类间距离时则有六种不同的方法，分别是最短距离法、最长距离法、类平均法、重心法、中间距离法、离差平方和法。下面我们用iris数据集来进行聚类分析，在R语言中所用到的函数为hclust。

首先提取iris数据中的4个数值变量，然后计算其欧氏距离矩阵。然后将矩阵绘制热图，从图中可以看到颜色越深表示样本间距离越近，大致上可以区分出三到四个区块，其样本之间比较接近。 data=iris[,-5] dist.e=dist(data,method='euclidean') heatmap(as.matrix(dist.e),labRow = F, labCol = F) X 然后使用hclust函数建立聚类模型，结果存在model1变量中，其中ward参数是将类间距离计算方法设置为离差平方和法。

使用plot(model1)可以绘制出聚类树图。如果我们希望将类别设为3类，可以使用cutree函数提取每个样本所属的类别。 model1=hclust(dist.e,method='ward') result=cutree(model1,k=3) 为了显示聚类的效果，我们可以结合多维标度和聚类的结果。先将数据用MDS进行降维，然后以不同的的形状表示原本的分类，用不同的颜色来表示聚类的结果。可以看到setose品种聚类很成功，但有一些virginica品种的花被错误和virginica品种聚类到一起。

距离样本多维标度间距

# 上一篇：我用css写,只想要div左右两边有边框,上下没有边框,要怎么写呢?

# 下一篇：哪位大神与CSS+DIV 的API哇，还有HTML颜色表哟，谢谢了，如果有请您发至4，5，964，2792