R语言中的多元方差分析

Python016

R语言中的多元方差分析,第1张

R语言中的多元方差分析1、当因变量(结果变量)不止一个时,可用多元方差分析(MANOVA)对它们同时进行分析。library(MASS)attach(UScereal)y <- cbind(calories, fat, sugars)aggregate(y, by = list(shelf), FUN = mean)Group.1 calories fatsugars1 1 119.4774 0.6621338 6.2954932 2 129.8162 1.3413488 12.5076703 3 180.1466 1.9449071 10.856821cov(y)calories fat sugarscalories 3895.24210 60.674383 180.380317fat60.67438 2.713399 3.995474sugars180.38032 3.995474 34.050018fit <- manova(y ~ shelf)summary(fit)Df Pillai approx F num Df den Df Pr(>F) shelf 1 0.195944.955 3 61 0.00383 **Residuals 63 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1summary.aov(fit)Response calories :Df Sum Sq Mean Sq F valuePr(>F)shelf1 45313 45313 13.995 0.0003983 ***Residuals 63 2039823238 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response fat :Df Sum Sq Mean Sq F value Pr(>F) shelf1 18.421 18.4214 7.476 0.008108 **Residuals 63 155.236 2.4641---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Response sugars :Df Sum Sq Mean Sq F value Pr(>F) shelf1 183.34 183.34 5.787 0.01909 *Residuals 63 1995.87 31.68 ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 12、评估假设检验单因素多元方差分析有两个前提假设,一个是多元正态性,一个是方差—协方差矩阵同质性。(1)多元正态性第一个假设即指因变量组合成的向量服从一个多元正态分布。可以用Q-Q图来检验该假设条件。center <- colMeans(y)n <- nrow(y)p <- ncol(y)cov <- cov(y)d <- mahalanobis(y, center, cov)coord <- qqplot(qchisq(ppoints(n), df = p), d, main = "QQ Plot Assessing Multivariate Normality", ylab = "Mahalanobis D2")abline(a = 0, b = 1)identify(coord$x, coord$y, labels = row.names(UScereal))如果所有的点都在直线上,则满足多元正太性。2、方差—协方差矩阵同质性即指各组的协方差矩阵相同,通常可用Box’s M检验来评估该假设3、检测多元离群点library(mvoutlier)outliers <- aq.plot(y)outliers

@[toc]

假设检验的前提是要满足正态分布和方差齐性

组内平方和SSE:同一组内的数据误差平方和

组间平方和SSA:不同组之间的数据误差平方和

一个分类型自变量

例如四个班级学生的语文成绩,班级是分类型自变量,四个班级是自变量的四个水平

测试班级对成绩的影响

因为p<0.001,说明班级对成绩的影响非常显著

图中跨越0分界线的班级对,有较大可能落在0上,也就是说两个班级之间没有明显差异。其他班级说明都有明显差异。

同一班级在大学三年的三次测试

p<0.001,说明学生成绩在大学三年中有显著差异。球形检验的p-value大于0.05,所以可以认为方差相等。

Mauchly's Test for Sphericity :适用于重复测量时检验不同测量之间的差值的方差是否相等,用于三次以及三次之上。

Sphericity Corrections :球形矫正,当方差不相等时进行矫正,矫正方法有the Greenhouse-Geisser (1959), the Huynh-Feldt (1976), 简称GG和HF。

两个分类型自变量

例如探究 词汇量 话题熟悉度 对学生作文成绩的影响

词汇量和话题熟悉度两个变量对成绩的影响都很显著,交互项对成绩影响不显著。

探究班级和测试次数对学生成绩的影响

班级和测试次数在原始检验中都很显著,然后交叉项不显著。

但是在球形检验中,推翻了方差齐性的假设,所以tests需要使用球形矫正之后的p值,classes不用。

矫正之前tests的p-value = 3.482406e-04,矫正之后的p-value = 0.001左右。