Unifrac是一个十分常用的衡量不同群落之间谱系结构差异的指标。在R语言中,计算unifrac的函数不只一种,不同函数之间有什么差别呢?本文目的就是对几个常用的计算unifrac的函数的使用方法做个记录。
比较对象
首先,每个包的安装方法:
其次,每个函数的使用方法:
为了更容易区分函数是来自哪个包,每个函数前面都添加了包的名字。
最后,每个函数的运行效率:
虽然phyloseq的安装稍微有些麻烦,并且在计算unfirac之前还需要先转换一下数据类型,但其计算unfirac的效率最高。
对于每个函数的计算时间是否是随OTU数目和样品数目线性增加,还需要进一步探究。
需要注意的是:
picante和PhyloMeasures只能计算unweighted unfirac。
GUniFrac不仅同时计算weighted和unweighted unfirac,同时还能通过参数调节丰度加权的程度。
phyloseq通过控制参数weighted=T或F,可以计算weighted和unweighted unifrac。
R语言是一个开源、跨平台的科学计算和统计分析软件包,具有丰富多样、强大的的统计功能和数据分析功能,R语言是主要用于统计分析、绘图的语言和操作环境。R中的统计分析通过使用许多内置函数来执行。 这些函数大多数是R基础包的一部分。 这些函数将R向量作为输入和参数,并给出结果。
模式是一组数据中出现次数最多的值。 Unike平均值和中位数,模式可以同时包含数字和字符数据。
R语言没有标准的内置函数来计算模式。 因此,我们创建一个用户函数来计算R语言中的数据集的模式。该函数将向量作为输入,并将模式值作为输出。