R语言之书笔记:常见的概率分布

Python016

R语言之书笔记:常见的概率分布,第1张

两种可能结果的离散随机变量概率分布 ,失败是0,成功是1,p是成功的概率

dbinorm() :提供任何有效x的概率质量函数

pbinom() :提供累积概率分布,求结果成功q次及q次以下的累积概率,给定分位数值q,输出累积概率p

qbinom() :累积概率分布的逆( pbinom() 的逆),给定累积概率p,输出分位数值q

rbinom() :产生n个服从二项分布的随机数

3. dpois() , ppois() , qpois() , rpois()

dt() , pt() , qt() , rt()

R语言中一组数据服从威布尔分布。

首先可以利用fitdistr函数求得weibull分布的形状参数和尺寸参数,假设数据为x:library(MASS) #fitdistr需要利用MASS包fitdistr(x, densfun = "weibull",lower=0)得到形状参数shape与尺度参数scale

然后利用ks.test进行检验:ks.test(jitter(x),"pweibull",shape,scale)

上边的jitter用来做小扰动,因为如果x中有重复数据的话ks.test会报错,如果x中没有重复数据则不需要jitter。shape是得到的形状参数,scale是得到的尺度参数。

ks.test得到两个结果,一个是D,越小越好,一个是p-value,这个值要大于0.05

2.夏皮罗检验(shapiro.test)

当w接近1,p >0.05时,说明数据符合正态分布,这个检验只适合于3-5000个数据,样本数量不在这个范围内的话,会报错

补充从b站麦子那里学到的另外三种判断是不是正态分布的可视化方法

标准正态分布的概率密度函数中F(x)代表的是正态分布中数值<x的概率

案例1中的做法是先把数据标准化,然后查表进行计算,也可以通过R进行计算

- 中心极限定理