r语言偏度峰度函数需要安装什么包

Python018

r语言偏度峰度函数需要安装什么包,第1张

moments包。

R语言使用moments包计算偏度(Skewness)和峰度(Kurtosis)实战计算偏度(Skewness)和峰度(Kurtosis)、确定样本数据是否具有与正态分布匹配的偏度和峰度(假设检验)。

当作正态处理: 凡中度及以下偏度的数据(包括重尾分布),涉及均值比较或回归系数估计的,样本量超过10个,可以当作正态处理。原因是中心极限定理。 如果实验过程是随机化顺序的,这时候这时候对均值的检验(例如使用t检验或F检验)是随机化检验方法的近似,不需要考虑正态性问题。

2.

变换为正态: 当数据严重偏离正态,或者比较的是方差(即与均值无关),这时中心极限定理帮不上忙,就最好通过数据变换转化为正态分布。 变换一般是幂变换。 分为经验法和Box-cox法(过程能力指数CpK计算时还常用Johnson变换)。 经验法就是求数据的2次方,或1/2次方,或1/4次方,或-1次方,或取Ln。看哪一种变换后近似正态。 Box-cox法是原理相同但更精确、更正式的方法。

3.

针对专门分布的方法: 例如针对相应指数族分布使用广义线性模型。

一行一行来。

basic.stats <- function(x,more=F) { # 建立名叫basic.stats的函数,参数为x和more,more默认是F就是不用输入,但你也可以输入,有额外效果。

stats <- list() #建立名叫stats的列表类型变量

clean.x <- x[!is.na(x)] #把x中的NA全部踢掉,留下有用的数据记为clean.x

stats$mean <- mean(clean.x)# 计算clean.x的均值 赋给列表中的mean单元

stats$std <- sd(clean.x)# 计算clean.x的标准差 赋给列表中的std单元

stats$med <- median(clean.x) # 计算clean.x的中位数 赋给列表中的med单元

if(more) { #如果你在函数中输入2个变量,默认是basic.stats(x),你可以输入basic.stats(x, y) 有额外效果

stats$skew <- sum(((clean.x-stats$mean)/stats$std)^3)/length(clean.x) #计算偏度 赋给列表中的skew单元

stats$kurt <- sum(((clean.x-stats$mean)/stats$std)^4)/length(clean.x) - 3 #计算峰度 赋给列表中的kurt单元

unlist(stats) #最后拆解列表变量stats 使其变为简单的向量数值变量