首先,R中很多安装包中有自带的数据集,所以在使用某个数据前先看它是在哪个包中。具体可以参考 R各个包里面的数据集列表 .
这次主要用MASS包中的crabs数据
qqnorm() 可以绘制QQ图。通过绘制的图是否呈现一直线判断是否符合正态分布。另外还有一个 qqline() 函数,在QQ图中绘制一条直线,QQ图中的点越接近这条直线,表示数据越接近正态分布。
上述判断方法相对比较主观, shapiro.test() 相对比较客观。只需将检验的数据当作shapiro。test()的函数即可。
显示为
p-value反应服从正态分布的概率,值越小越小的概率符合,通常0.05做标准,大于0.05则表示符合正态分布(此处为0.2542),故符合正态分布
接下来分别检验公螃蟹和母螃蟹是否符合正态分布
可见都符合正态分布。
x<-c(-10:10)shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.95993, p-value = 0.5148
shapiro.test(c(x,"a"))
Error: is.numeric(x) is not TRUE
你的数据不全是数字。