r语言可以完成生物信息哪些工作

Python027

r语言可以完成生物信息哪些工作,第1张

R可以完成:

1、处理一些简单的有格式的文本数据,包括矩阵等

2、画一些简单的统计图,比如直方图,箱线图等

3、分析一些专门的数据,比如芯片数据,RNA-seq数据等

4、画一些专业的图,比如热图之类的

     ,即主坐标分析(Principal Coordinates Analysis),是一种 用于研究样本微生物群落组成相似性或差异性 的数据降维分析方法。PC1 和PC2 是两个主坐标成分,图中每个点代表一个样本,点的颜色代表样本的分组,样本间的距离越近代表微生物群落结构越相似。图中圆圈一般是置信水平为95%时的置信椭圆,用于比较组间的群落结构组成相似性。

如果只有一个响应变量数据,而没预测器(解释变量),我们仅仅需要、也只能归纳这个变量的分布特征(如通过直方图、中值,标准差、四分位极差等)。如果有多个响应变量,依然没有解释变量,我们可以用排序(间接梯度分析)来分析数据,例如可以用主成分分析(PCA)、对应分析(CA)、去趋势对应分析(DCA)和非度量多维尺度分析(NMDS),当然也可以用等级分类,如聚类的方法将样方分为有区别的几类。

如果我们有一个或多个的解释变量,要分析一个响应变量,可以用广义的回归模型,包括传统的回归模型和方差分析、协方差分析。这类分析统称为一般线性模型(general linear model),最近在一般线性模型基础上,发展出了广义线性模型(generalizedlinear models, GLM)和广义可加模型(generalized additivemodels, GAM)。有关这回归模型更多的信息,我们将在第8章讨论。

如果有多个响应变量需要分析,解释变量一个或多个,我们可以通过直接梯度排序来分析解释变量与多个响应变量(群落学里通常是物种)之间的关系。常用的有冗余分析(RDA)和典范对应分析(CCA)等排序技术。

你的问题里面氮源算是解释变量,产生的菌种属于相应变量。如果你测定的菌种指标为多个,我感觉你就用canoco做一个CCA应该就行了(还有,这种方式应用在生态上只是较多而已,但用在你的实验上应该没什么问题)。CCA是首先针对你的菌种进行排序,然后再与氮源进行线性结合;当然,如果你测定的菌种指标只有一个,那就用SPSS之类的简单软件分别进行线性回归,然后看哪个拟合的结果(r)好就行了。祝早日发表。