r语言偏度峰度函数需要安装什么包

Python039

r语言偏度峰度函数需要安装什么包,第1张

moments包。

R语言使用moments包计算偏度(Skewness)和峰度(Kurtosis)实战计算偏度(Skewness)和峰度(Kurtosis)、确定样本数据是否具有与正态分布匹配的偏度和峰度(假设检验)。

读《Discovering Statistics Using R》第五章 Exploring assumptions做的笔记。本笔记对应章节为5.5.2,主要介绍使用偏度系数和峰度系数考察正态性假设。

上一篇笔记 《Discovering Statistics Using R》笔记-图示法考察正态性假设 中介绍了用图示法考察正态性假设,图示法考察的较大弊端是比较主观。我们可以用偏度系数和峰度系数来定量考察数据分布的形状。

一个生物学家怀疑音乐节会对人的健康产生影响,他找了810个音乐会观众,收集了音乐节三天他们的卫生情况,卫生情况得分0-4.我们使用该数据的去除极端值后的版本 DownloadFestival(No Outlier).dat

使用 psych 包的 describe() 可以生包括峰度系数、偏度系数在内的一系列统计量。

skew即为偏度系数,krutosis即为峰度系数。

另外也可以使用 pastecs 包的 stat.desc() 来完成同样的任务。

实际上在R中,总可以找到两个甚至更多个方法来完成同一个任务。

因为 stat.desc() 原始的输出用科学计数法来显示,不太好看,用 round() 调整了输出数字显示的位数。

我们可以把偏度系数和峰度系数转换为标准正态分布的Z值。准换为Z值后,

将某统计量转换为标准正态分布Z值,只需要将该统计量减去该统计量分布的均值后再除以该统计量的标准差(标准误)就行了。这里我们假设检验中原假设是系数为0,所以减去的均值用0来带入。对应标准误可以由R来计算。

标准正态分布下双侧尾部面积0.05对应Z值为1.96。因此转换后的Z值如果绝对值大于1.96,对应P值就小于0.05.

应用时需要注意:大样本量下标准误会较小,即使系数距离0很近得到的Z值也会很大,容易拒绝原假设。因此在较大样本量下,检验水准的标准应当提高(比如说0.01,对应Z值为2.58)。样本量如果非常大(书中说是大于200,但我觉得具体样本量多大算非常大要结合具体假设检验考察的问题),这种显著性检验意义就不大了(因为即使很小的差异也很容易有统计学意义),更重要的是作图观察数据分布的形状。

在上面 stat.desc() 的运行结果中有skew.2SE和kurt.2SE。分别对应偏度系数除以2倍标准误和峰度系数除以2倍标准误。即转换后的Z值再除以2(这里将1.96近似为2处理了).因此skew.2SE绝对值大于1,就意味着偏度系数为0的差异性检验具有统计学意义。kurt.2SE同理。

注意到 stat.desc() 的运行结果中还给出了正态性检验的结果,在之后的笔记中再详细介绍。