R语言进行PCoA分析

Python017

R语言进行PCoA分析,第1张

#PCoA 分析在R语言中进行主要依赖于以下得包,进行这个分析得主要可以应用于形态学数据得相似与差异性分析。

library(ade4)

library(ggplot2)

library(RColorBrewer)

library(vegan)

这里我们使用R自带得数据iris

data(iris)

在R语言中通常都会使用这个数据进行案例分析

#iris

data(iris)

iris

data01<-iris[,-5]#数据预处理,去掉最后一列得数据标签

data01

dis01<-vegdist(data01,method = "euclidean")#这里是为了算矩阵距离,方法根据数据选择合适得方法

dis01

pcoa1<- dudi.pco(dis01, scan = FALSE,nf=3)#进行PCoA分析

pcoa1

pcoa1_eig<-pcoa1$eig[1:2]/sum(pcoa1$eig)#算一下前两列对整个数据得解释比例

pcoa1_eig

samplesite1<-data.frame({pcoa1$li})[1:2]#将前两列的数据分析结果放到sample_site1里面

sample_site1

sample_site1$names<-rownames(sample_site1)#设置名称

sample_site1$names

iris$Species

sample_site1$level<-factor(iris$Species,levels = c("setosa","versicolor","virginica"))#设置level的标签

sample_site1$level

names(sample_site1)[1:2]<-c("PCoA1","PCoA2")

p<-ggplot(sample_site1, mapping=aes(PCoA1, PCoA2,color=level))+theme_classic()

p<-p+geom_point()#绘制散点图

p

     ,即主坐标分析(Principal Coordinates Analysis),是一种 用于研究样本微生物群落组成相似性或差异性 的数据降维分析方法。PC1 和PC2 是两个主坐标成分,图中每个点代表一个样本,点的颜色代表样本的分组,样本间的距离越近代表微生物群落结构越相似。图中圆圈一般是置信水平为95%时的置信椭圆,用于比较组间的群落结构组成相似性。