检验数据服从什么分布 r语言

Python018

检验数据服从什么分布 r语言,第1张

R语言中一组数据服从威布尔分布。

首先可以利用fitdistr函数求得weibull分布的形状参数和尺寸参数,假设数据为x:library(MASS) #fitdistr需要利用MASS包fitdistr(x, densfun = "weibull",lower=0)得到形状参数shape与尺度参数scale

然后利用ks.test进行检验:ks.test(jitter(x),"pweibull",shape,scale)

上边的jitter用来做小扰动,因为如果x中有重复数据的话ks.test会报错,如果x中没有重复数据则不需要jitter。shape是得到的形状参数,scale是得到的尺度参数。

ks.test得到两个结果,一个是D,越小越好,一个是p-value,这个值要大于0.05

2.夏皮罗检验(shapiro.test)

当w接近1,p >0.05时,说明数据符合正态分布,这个检验只适合于3-5000个数据,样本数量不在这个范围内的话,会报错

补充从b站麦子那里学到的另外三种判断是不是正态分布的可视化方法

标准正态分布的概率密度函数中F(x)代表的是正态分布中数值<x的概率

案例1中的做法是先把数据标准化,然后查表进行计算,也可以通过R进行计算

- 中心极限定理

作为一种语言进行统计分析,R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布,生成该分布下的随机数。其中有许多常用的个分布可以直接调用。

在R中各种概率函数都有统一的形式,即一套统一的前缀+分布函数名:

d 表示密度函数(density)。

p 表示分布函数(生成相应分布的累积概率密度函数)。

q 表示分位数函数,能够返回特定分布的分位数(quantile)。

r 表示随机函数,生成特定分布的随机数(random)。

扩展资料:

注意事项:

1、使用了错误大小写:help()是正确的,其他都是错误的。

2、不要忘记使用必要的引号:install.packages(“gclus”)。

3、在函数调用时,不要忘记使用括号:help()。

4、在Windous上,路径名中使用的是\。

5、R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。数据框是用来存储数据集的主要数据结构。

参考资料来源:百度百科-R语言

参考资料来源:百度百科-标准正态分布

参考资料来源:百度百科-散点图