《R语言实战》自学笔记57-ANOVA模型拟合

Python021

《R语言实战》自学笔记57-ANOVA模型拟合,第1张

虽然ANOVA和回归方法都是独立发展而来,但是从函数形式上看,它们都是广义线性模型

的特例。

aov(formula, data = dataframe)

表中y是因变量,字母A、B、C代表因子。

表中小写字母表示定量变量,大写字母表示组别因子,Subject是对被试者独有的标识变量。

表达式中效应的顺序在两种情况下会造成影响:

(a)因子不止一个,并且是非平衡设计;

(b)存在协变量。出现任意一种情况时,等式右边的变量都与其他每个变量相关。此时,我们无法清晰地划分它们对因变量的影响。

R默认类型I(序贯型)方法计算ANOVA效应(参考补充内容“顺序很重要!”)。可以这样写:y ~ A + B + A:B。

R中的ANOVA表的结果将评价:

 A对y的影响;

控制A时,B对y的影响;

控制A和B的主效应时,A与B的交互效应。

样本大小越不平衡,效应项的顺序对结果的影响越大。一般来说,越基础性的效应越需要放在表达式前面。具体来讲,首先是协变量,然后是主效应,接着是双因素的交互项,再接着是三因素的交互项,以此类推。对于主效应,越基础性的变量越应放在表达式前面,因此性别要放在处理方式之前。有一个基本的准则:若研究设计不是正交的(也就是说,因子和/或协变量相关),一定要谨慎设置效应的顺序。

参考资料:

数据准备

多元方差分析( multivariate analysis of variance ,MANOVA),亦称为多变量方差分析,即表示多元数据的方差分析,是一元方差分析的推广。作为一个多变量过程,多元方差分析在有两个或多个因变量时使用,并且通常后面是分别涉及各个因变量的显着性检验。

当因变量(结果变量)不止一个时,可用多元方差分析(MANOVA)对它们同时进行分析。

结果解读:可以看出v1,v2和v3在nitrogen之间存在很大的不同(P值均小于0.05)。

单因素多元方差分析有两个前提假设,一个是多元正态性,一个是方差—协方差矩阵同质性。

第一个假设即指因变量组合成的向量服从一个多元正态分布。可以用Q-Q图来检验该假设条

件。

方差—协方差矩阵同质性即指各组的协方差矩阵相同,通常可用Box’s M检验来评估该假设。

最后,还可以使用mvoutlier包中的ap.plot()函数来检验多元离群点。

如果多元正态性或者方差—协方差均值假设都不满足,又或者你担心多元离群点,那么可以

考虑用稳健或非参数版本的 MANOVA检验。稳健单因素 MANOVA可通过 rrcov包中的

Wilks.test()函数实现。vegan包中的adonis()函数则提供了非参数MANOVA的等同形式。

稳健检验对离群点和违反MANOVA假设的情况不敏感,结果说明在nitrogen的两个水平下,v1、v2、v3的值均存在显著不同。

参考资料: