R语言 RDA分析(去冗余物种)

Python011

R语言 RDA分析(去冗余物种),第1张

也做了挺多次RDA分析,自己现在小结一下RDA分析流程:

就我个人而言,虚线前面都是不太经历的步骤,我一般不会主动删去样品的环境信息,因为我接触的菌群这块本来就没有什么多余的环境信息-_-||,所以我的重点放在怎么去除多余OTU或菌群上面。

一般而言,我首先会做一次差异分析,挑选有差异的OTU或菌群进行展示(phyloseq推荐使用DESeq2和edgeR,详见 Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible ),这里不是重点不在赘述。

但是差异OTU或菌群还有可能太多,RDA呈现出来密密麻麻的,调也得调好久,最后还是好不美观。

偶然间,发现envfit不仅可以评估环境因子的显著性,也可以评估物种的相关性和显著性,这为我们进一步去取冗余物种提供了条件,值得记录下来学习。

示例:

Rdata是生信技能树 生信爆款入门课程 geo数据挖掘长脚本管理用到的一个函数。为拓展课堂所学知识,现在探讨下它和RDS的区别。

.rds和.Rdata (也称为.rda )文件都可用于以R本机格式存储R对象。与非本机存储方法(例如write.table相比,保存此方法有多个优点:

1)将数据恢复到R更快

2)它保持在数据中编码的R特定信息(例如,属性,变量类型等)。

但他们也有一点不同。

RDS是用saveRDS和readRDS,Rdata使用save和load。

saveRDS / readRDS仅处理单个R对象。但是,它们比多对象存储方法更灵活,因为还原对象的对象名称不必与存储对象时的对象名称相同。

例如,

一个安装包安装了之后还需要加载

install.packages("rda") 这个函数运行一次之后就下载好了,

而每次要调用这个数据包就需要使用,

library(rda)这个函数。