输入为一个vector,我们以a <- seq(1, 250, 1)做为示例数据
利用qqnorm函数直接绘制出了如下正态检验qq图
还可以进一步使用qqline命令在qq图上加上标准直线
注:qqline的默认算法为向量a上四分位数和下四分位数对应两个点的连线
Step 1: 首先我们算出vector中每一个数对应的百分位数
在向量a中,数字1对应的累积比例(即小于等于数字1的频率)为1/length(a) = 0.04,数字250对应的累积比例为250/length(a) = 100%
Step 2: 根据累积比例数计算出正态分布对应的百分位数值
直接绘制点图即为qqplot图
Step 3: 可以查看一下q值发现,最后的q值为Inf
这是因为百分位100%对应的正态分布数值为无穷大,所以最后得出的图与R自带的qqnorm的稍微有一点点区别,这是因为在内置的qqnorm函数中对累积百分数进行了调整,为了避免inf的出现,使用 t <- (rank(a) -0.5)/length(a) 调整后得出的结果与qqnorm的结果图就完全一致了。
Step 4: 绘制标准直线
如果是依据标准正态分布做的qq图,则标准直线截距为mean(a),斜率为sd(a)
[图片上传失败...(image-50be7a-1512789490785)]
如果是依据(mean(a), var(a))正态分布做的qq图,则标准直线为y=x
[图片上传失败...(image-4e2370-1512789490785)]
pp plot横轴为实际累积概率,即上文qq plot中的变量t
纵轴为期望累积的概率,标准直线为 y=x
[图片上传失败...(image-682bd0-1512789490785)]
结果大致呈一条直线则说明大致服从正态分布
快速计算累积百分数的方法:
[图片上传失败...(image-de8e63-1512789490785)]
参考:
https://wenku.baidu.com/view/c661ebb365ce050876321319.html
http://data.library.virginia.edu/understanding-q-q-plots/
http://www.cnblogs.com/xianghang123/archive/2012/08/08/2628623.html
https://d.cosx.org/d/18521-18521
#####以10个数据和30个数据为例说明。####my.qqplot <- function(y){
op <- par(mfrow = c(1, 1))
N <- length(y)
n <- seq(1, N)
xais <- qnorm((n - (.5*N) /N)/ N)
#####中间三句可选,只是为了输出计算过程######
mid <- cbind(sort(y), n, n/N, (n-(.5*N)/N)/N , xais)
colnames(mid) <- c("y", "rank", "cumpercent", "adj-cumper","xaix")
print(mid)
#####中间三句可选,只是为了输出计算过程######
par(mfrow = c(2,1))
qqnorm(y)
plot(sort(y) ~ xais, main = 'my qqplot')
par(op)
}
y <- rnorm(10, mean = 20, s = 50)
my.qqplot(y)
y rank cumpercentadj-cumper xaix
[1,] 2.877321 1 0.1 0.05 -1.6448536
[2,] 6.930063 2 0.2 0.15 -1.0364334
[3,] 16.461444 3 0.3 0.25 -0.6744898
[4,] 36.130825 4 0.4 0.35 -0.3853205
[5,] 40.477883 5 0.5 0.45 -0.1256613
[6,] 50.534636 6 0.6 0.55 0.1256613
[7,] 53.425025 7 0.7 0.65 0.3853205
[8,] 54.554269 8 0.8 0.75 0.6744898
[9,]120.496268 9 0.9 0.85 1.0364334
[10,] 125.290253 10 1.0 0.95 1.6448536
R语言基于R语言的方差分析
行秋即离
原创
关注
2点赞·2147人阅读
1、导入相关的包
单因素方差分析
一、正态性检验
with(ToothGrowth, tapply(len, dosef, shapiro.test))
二、方差齐性检验
三组以上的因子需要用leveneTest()检验
leveneTest(len~dosef, ToothGrowth)
不过有一些教材认为应该用残差来检验正态性和方差齐性
因此这里需要进行一次方差分析
AOV1 <- aov(len~dosef, ToothGrowth)
summary(AOV1)
这里面的Residuals就是残差的意思,所以要将这数据提取处理,也可以在AOV1数据上面索引
三、诊断模型
res1 <- residuals(AOV1) 或者 res1 <- AOV1$residuals
shapiro.test(res1)
ggqqplot(res1) 画出qq图看以下
科普:
QQPlot图是用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于正态分布。
方差齐性的检验和前面的差不多就是因变量变成了残差