如何用r语言求正态分布的标准差

Python027

如何用r语言求正态分布的标准差,第1张

用r语言求正态分布的标准差:产生100个均值为0标准差为1的正态分布随机数:rnorm(100,mean=0,sd=1)指数分布数dnorm(x,mean=5,sd=1,log=TRUE)。

正态分布的标准差正态分布N~(μ,duδ^2),方差D(x)=δ^2,E(x)=μ。服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。μ维随机向量具有类似的概率规律时,随机向量遵从多维正态分布。

标准正态分布

又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。

Shapiro-Wilk检验 用来检验是否数据符合正态分布 ,类似于线性回归的方法一样,是检验其于回归曲线的残差。该方法作者推荐在样本量很小的时候使用,比如N<20。但是也有作者推荐在大数据集上使用。该作者将这种修改后的方法运用在R语言的stats包中的 shapiro.test 函数中。

为排序后的样本数据, 为待估常量,假设样本数据确实符合一个未知均值 、标准差 的正态分布,那么样本数据就会满足下列一次函数式:

其中xi是随机正态分布N(0,1)中排序数据。

统计量越大则表示数据越符合正态分布,但是仅凭这一个参数是不够的, 在非正态分布的小样本数据中也经常会出现较大的W值。 该统计量的分布是未知的,因此需要通过模拟或者查表来估计其概率。由于原假设是其符合正态分布,所以当P值小于指定显著水平时表示其不符合正态分布。

主要分析p-value,由于原假设H0假定数据和正态分布没有差异,p<0.05否定原假设,说明数据不符合正态分布。

换一组数据

由于原假设H0假定数据和正态分布没有差异,p显著大于0.05,不能否定原假设,说明可认为数据符合正态分布。

由于原假设H0假定数据和正态分布没有差异,p显著小于0.05,否定原假设,说明数据不符合正态分布。