首先可以利用fitdistr函数求得weibull分布的形状参数和尺寸参数,假设数据为x:library(MASS) #fitdistr需要利用MASS包fitdistr(x, densfun = "weibull",lower=0)得到形状参数shape与尺度参数scale
然后利用ks.test进行检验:ks.test(jitter(x),"pweibull",shape,scale)
上边的jitter用来做小扰动,因为如果x中有重复数据的话ks.test会报错,如果x中没有重复数据则不需要jitter。shape是得到的形状参数,scale是得到的尺度参数。
ks.test得到两个结果,一个是D,越小越好,一个是p-value,这个值要大于0.05
2.夏皮罗检验(shapiro.test)
当w接近1,p >0.05时,说明数据符合正态分布,这个检验只适合于3-5000个数据,样本数量不在这个范围内的话,会报错
补充从b站麦子那里学到的另外三种判断是不是正态分布的可视化方法
标准正态分布的概率密度函数中F(x)代表的是正态分布中数值<x的概率
案例1中的做法是先把数据标准化,然后查表进行计算,也可以通过R进行计算
- 中心极限定理
作为一种语言进行统计分析,R有一个随机数生成各种统计分布功能的综合性图书馆。R语言可以针对不同的分布,生成该分布下的随机数。其中有许多常用的个分布可以直接调用。
在R中各种概率函数都有统一的形式,即一套统一的前缀+分布函数名:
d 表示密度函数(density)。
p 表示分布函数(生成相应分布的累积概率密度函数)。
q 表示分位数函数,能够返回特定分布的分位数(quantile)。
r 表示随机函数,生成特定分布的随机数(random)。
扩展资料:
注意事项:
1、使用了错误大小写:help()是正确的,其他都是错误的。
2、不要忘记使用必要的引号:install.packages(“gclus”)。
3、在函数调用时,不要忘记使用括号:help()。
4、在Windous上,路径名中使用的是\。
5、R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。数据框是用来存储数据集的主要数据结构。
参考资料来源:百度百科-R语言
参考资料来源:百度百科-标准正态分布
参考资料来源:百度百科-散点图