2.夏皮罗检验(shapiro.test)
当w接近1,p >0.05时,说明数据符合正态分布,这个检验只适合于3-5000个数据,样本数量不在这个范围内的话,会报错
补充从b站麦子那里学到的另外三种判断是不是正态分布的可视化方法
标准正态分布的概率密度函数中F(x)代表的是正态分布中数值<x的概率
案例1中的做法是先把数据标准化,然后查表进行计算,也可以通过R进行计算
- 中心极限定理
二维正态分布概率密度函数的表达式
就这个图,在三维的平面内的,XOY面是指X,Y的大小,而它的高度则是XY分别取那个点时所对应的频率。
PS:你别看下方的坐标,标准的二维正态分布概率密度函数的图,最高点在xoy平面内的(0,0)处,所对应的频率最高。
分布函数为f(x,y)的积分,积分范围(-∞,-∞)到(x,y)。
对于相关系数为零的情况,分布函数又可以写成F(x,y)=FX(x)FY(y)
,等于两个正态分布函数的乘积。
用r语言求正态分布的标准差:产生100个均值为0标准差为1的正态分布随机数:rnorm(100,mean=0,sd=1)指数分布数dnorm(x,mean=5,sd=1,log=TRUE)。
正态分布的标准差正态分布N~(μ,duδ^2),方差D(x)=δ^2,E(x)=μ。服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。μ维随机向量具有类似的概率规律时,随机向量遵从多维正态分布。
标准正态分布
又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。