R语言之书笔记:常见的概率分布

Python016

R语言之书笔记:常见的概率分布,第1张

两种可能结果的离散随机变量概率分布 ,失败是0,成功是1,p是成功的概率

dbinorm() :提供任何有效x的概率质量函数

pbinom() :提供累积概率分布,求结果成功q次及q次以下的累积概率,给定分位数值q,输出累积概率p

qbinom() :累积概率分布的逆( pbinom() 的逆),给定累积概率p,输出分位数值q

rbinom() :产生n个服从二项分布的随机数

3. dpois() , ppois() , qpois() , rpois()

dt() , pt() , qt() , rt()

R一个很方便的用处是提供了一套完整的统计表集合。函数可以对累积分布函数P(X≤x),概率密度函数,分位函数(对给定的q,求满足P(X≤x) >q的最小x)求值,并根据分布进行模拟

在统计学中,产生随机数据是很有用的,R可以产生多种不同分布下的随机数序列。这些分布函数的形式为rfunc(n,p1,p2,...),其中func指概率分布函数,n为生成数据的个数,p1, p2, . . .是分布的参数数值。上面的表给出了每个分布的详情和可能的缺省值(如果没有给出缺省值,则意味着用户必须指定参数)。

例:用0~1之间的均匀分布产生10个随机点

>runif(10)

[1] 0.961465376 0.0075219250.193619234 0.137027246 0.739370654 0.072907082

[7] 0.674551635 0.6507778110.984664183 0.796723066

大多数这种统计函数都有相似的形式,只需用d、p或者q去替代r,比如密度函数(dfunc(x, ...)),累计概率密度函数(也即分布函数)(pfunc(x,...))和分位数函数(qfunc(p, ...),0<p<1)。最后两个函数序列可以用来求统计假设检验中P值或临界值。例如,显著性水平为5%的正态分布的双侧临界值是:

>qnorm(0.025)

[1] -1.959964

>qnorm(0.975)

————————————————

ppois是泊松分布的分布函数(即用来求累计概率),因为是离散的,所以只会在整数左右有变化,看最下面的图像比较容易懂,比如q=0.5就和q=0.9的结果一样,q=1就和q=1.2的结果一样。

一般用法:

ppois(q, lambda, lower.tail = TRUE, log.p = FALSE)

q:官方帮助文档说是分位数,我理解是指定x轴上的点。

lambda:就是泊松分布的参数λ

lower.tail:是逻辑变量,当它为真(TRUE,缺省值)时,分布函数的计算公式为

当lower.tail = FALSE时,分布函数的计算公式为

log, log.p是逻辑变量,当它为真(TRUE)时,函数的返回值不再是泊松分布,而是对数泊松分布.

比如lambda=1的分布函数作图如下: