R语言单因素、多因素方差分析ANOVA analysis of variance

Python018

R语言单因素、多因素方差分析ANOVA analysis of variance,第1张

@[toc]

假设检验的前提是要满足正态分布和方差齐性

组内平方和SSE:同一组内的数据误差平方和

组间平方和SSA:不同组之间的数据误差平方和

一个分类型自变量

例如四个班级学生的语文成绩,班级是分类型自变量,四个班级是自变量的四个水平

测试班级对成绩的影响

因为p<0.001,说明班级对成绩的影响非常显著

图中跨越0分界线的班级对,有较大可能落在0上,也就是说两个班级之间没有明显差异。其他班级说明都有明显差异。

同一班级在大学三年的三次测试

p<0.001,说明学生成绩在大学三年中有显著差异。球形检验的p-value大于0.05,所以可以认为方差相等。

Mauchly's Test for Sphericity :适用于重复测量时检验不同测量之间的差值的方差是否相等,用于三次以及三次之上。

Sphericity Corrections :球形矫正,当方差不相等时进行矫正,矫正方法有the Greenhouse-Geisser (1959), the Huynh-Feldt (1976), 简称GG和HF。

两个分类型自变量

例如探究 词汇量 话题熟悉度 对学生作文成绩的影响

词汇量和话题熟悉度两个变量对成绩的影响都很显著,交互项对成绩影响不显著。

探究班级和测试次数对学生成绩的影响

班级和测试次数在原始检验中都很显著,然后交叉项不显著。

但是在球形检验中,推翻了方差齐性的假设,所以tests需要使用球形矫正之后的p值,classes不用。

矫正之前tests的p-value = 3.482406e-04,矫正之后的p-value = 0.001左右。

对实验数据检验方差相等的正态分布总体均值是否相等。判断各因素对试验指标影响是否显著。根据影响实验指标条件的个数可以区分为:单因素方差分析,双因素方差分析,多因素方差分析

boxplot(目标变量~变量,data=数据框)

箱子中的黑线是中值,箱体是下边缘为1/4分位数,上边缘为3/4分位数。上下两侧为最小值和最大值。

第一列为均值差异,第二列为置信区间,最后为P值(校正后)

上方存在相同字母的组间差异不显著