用matlab画普通Q-Q图,R语言的代码如下:
install.packages(“car”)。
library(car)#安装并加载R包car。
qqPlot(data,diatribution=“t”,df=5)#将data中的数据与自由度为5的t分布比较,若满足x=y,则同分布。
如果要和其它类型的分布比较只需要把上一行代码中的distribution后的分布改一下就可以了,比如要与指数分布比较,那么改成distribution=“exp”就可以了。
介绍
如果两个分布相似,则该Q-Q图趋近于落在y=x线上。如果两分布线性相关,则点在Q-Q图上趋近于落在一条直线上,但不一定在y=x线上。Q-Q图可以用来可在分布的位置-尺度范畴上可视化的评估参数。
由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异。要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值。
输入为一个vector,我们以a <- seq(1, 250, 1)做为示例数据
利用qqnorm函数直接绘制出了如下正态检验qq图
还可以进一步使用qqline命令在qq图上加上标准直线
注:qqline的默认算法为向量a上四分位数和下四分位数对应两个点的连线
Step 1: 首先我们算出vector中每一个数对应的百分位数
在向量a中,数字1对应的累积比例(即小于等于数字1的频率)为1/length(a) = 0.04,数字250对应的累积比例为250/length(a) = 100%
Step 2: 根据累积比例数计算出正态分布对应的百分位数值
直接绘制点图即为qqplot图
Step 3: 可以查看一下q值发现,最后的q值为Inf
这是因为百分位100%对应的正态分布数值为无穷大,所以最后得出的图与R自带的qqnorm的稍微有一点点区别,这是因为在内置的qqnorm函数中对累积百分数进行了调整,为了避免inf的出现,使用 t <- (rank(a) -0.5)/length(a) 调整后得出的结果与qqnorm的结果图就完全一致了。
Step 4: 绘制标准直线
如果是依据标准正态分布做的qq图,则标准直线截距为mean(a),斜率为sd(a)
[图片上传失败...(image-50be7a-1512789490785)]
如果是依据(mean(a), var(a))正态分布做的qq图,则标准直线为y=x
[图片上传失败...(image-4e2370-1512789490785)]
pp plot横轴为实际累积概率,即上文qq plot中的变量t
纵轴为期望累积的概率,标准直线为 y=x
[图片上传失败...(image-682bd0-1512789490785)]
结果大致呈一条直线则说明大致服从正态分布
快速计算累积百分数的方法:
[图片上传失败...(image-de8e63-1512789490785)]
参考:
https://wenku.baidu.com/view/c661ebb365ce050876321319.html
http://data.library.virginia.edu/understanding-q-q-plots/
http://www.cnblogs.com/xianghang123/archive/2012/08/08/2628623.html
https://d.cosx.org/d/18521-18521