r_stuio回归函数的程序包是哪个?

2023-02-17 15:34:01Python014

r_stuio回归函数的程序包是哪个?,第1张

1、线性模型~回归分析：【包】：stats 【函数】：lm(formula, data, ...)逐步回归：step(lm(formula, data, ...))回归诊断：influence.measure(lm(formula, data, ...))多重共线性：kappa(XX,exact=T), eigen(XX)自相关检验：一阶：dwtest(y~x) 多阶：bgtest(y~x,order=2,type=”Chisq”)【备注】：1）stats包里的lm()可做多元线形模型，anova.mlm()比较多个多元线形模型，manova()做多元方差分析（MANOVA）。2）sn包的msn.mle()和 and mst.mle()可拟合多元偏正态和偏t分布模型。3）pls包提供偏最小二乘回归（PLSR）和主成分回归；4）ppls包可做惩罚偏最小二乘回归；5）dr包提供降维回归方法，如：片逆回归法(Sliced Inverse Regression)、片平均方差估计(sliced average variance estimation)。6）plsgenomics包做基于偏最小二乘回归的基因组分析。7）relaimpo包可评估回归参数的相对重要性。2、logistic回归：【包】：stats 【函数】：glm(formula, family=gaussian,data, ...)注：familybinomial(link = "logit") gaussian(link = "identity") Gamma(link = "inverse") inverse.gaussian(link = "1/mu^2") poisson(link = "log") quasi(link = "identity", variance = "constant") quasibinomial(link = "logit") quasipoisson(link = "log")

3、无监督分类~决策树：【包】：rpart 【函数】：rpart(formula,data, method="class",control=ct,parms=list(prior=c(p,1-p),split="information"))

rpart.plot(fit,branch=1,branch.type=2,type=1,extra=102,shadow.col=”gray”,box.col=”green”,

split.cex=1.2,main=”Kyphosis决策树”) #提供了复杂度损失修剪的修剪方法

printcp(fit):告诉分裂到哪一层，CP，nsplit，rel，error，交叉验证的估计误差（xerror），标准误差（xstd）

prune(fit,cp=fit$cptable[which.min(fit$cptable[,"xerror"]),"CP"])：剪枝函数

【备注】：1）CRAN的 MachineLearning任务列表有对树方法的细节描述。

2）分类树也常常是重要的多元方法，rpart包正是这样的包，

3）rpart.permutation包还可以做rpart()模型的置换（permutation）检验。

4）TWIX包的树可以外部剪枝。

5）hier.part包分割多元数据集的方差。

6）mvpart包可做多元回归树，

7）party包实现了递归分割（recursive partitioning），

8）rrp包实现了随机递归分割。

9）caret包可做分类和回归训练，进而caretLSF包实现了并行处理。

10）kknn包的k-近邻法可用于回归，也可用于分类。

4、支持向量机：

【包】：e1071，kernlab

【函数】：svm(x_train,y_train,type="C-classification",cost=10,kernel="radial",probability=TRUE,scale=FALSE)

svp=ksvm(x,y,type="C-svc",kernel="rbf",kpar=list(sigma=1),C=1)

5、无监督分类~聚类分析：

【包】：stats

【函数】：系统聚类：hclust(d,method=”complete”,members=NULL)

快速聚类：kmeans(x,centers,iter.max=10,nstart=1,algorithm=“Hartigan-Wong”)

距离函数：dist(x,method=”euclidean”,diag=FALSE,upper=FALSE,p=2)

【备注】：1）CRAN的Cluster任务列表全面的综述了R实现的聚类方法。

2）stats里提供等级聚类hclust()和k-均值聚类kmeans()。

3）cluster包里有大量的聚类和可视化技术，

4）clv包里则有一些聚类确认程序，

5）e1071包的classAgreement()可计算Rand index比较两种分类结果。

6）Trimmed k-means聚类分析可由trimcluster包实现，

7）聚类融合方法（Cluster Ensembles）由clue包实现，

8）clusterSim包能帮助选择最佳的聚类，

9）hybridHclust包提供一些混合聚类方法。

10）energy包里有基于E统计量的距离测度函数edist()和等级聚类方法hclust.energy()。

11）LLAhclust包提供基于似然（likelihood linkage）方法的聚类，也有评定聚类结果的指标。

12）fpc包里有基于Mahalanobis距离的聚类。

13）clustvarsel包有多种基于模型的聚类。

14）模糊聚类（fuzzy clustering）可在cluster包和hopach包里实现。

15）Kohonen包提供用于高维谱（spectra）或模式（pattern）的有监督和无监督的SOM算法。

16）clusterGeneration包帮助模拟聚类。

17）CRAN的Environmetrics任务列表里也有相关的聚类算法的综述。

18）mclust包实现了基于模型的聚类，

19）MFDA包实现了功能数据的基于模型的聚类。

用的最多的，是求均值的mean()函数，当然这里也要提到，像sum()这种求和函数，

还有sd(x) 标准差函数，var(x) 方差函数。min()求最小值，max()求最大值。

我们来具体试试，这里使用一个向量：

test<-c(2,4,5,23,199,25,78,90,12)

求最大值

>max(test)

[1] 19

求最小值

>min(test)

求和

>sum(test)

[1] 43

求标准差，求方差

>sd(test)

[1] 65.01154

>var(test)

[1] 4226.

在来试试最重要的均值

>mean(test)

[1] 48.66667

另外中位数计算。使用median()函数

>median(test)

[1] 23

如果给定一种概率分布，通常会有四类计算问题：

计算其概率密度density （d）计算其概率分布probability（p）计算其百分位数quantile （q）随机数模拟random （r）上面四类计算对应的英文首字母，就是R语言类率分布函数的开头字母。

比如说，正态分布是norm的化，那密度函数就是dnorm(),分布函数就是pnorm(),

更有用的是用相应分布生成随机数，比如rnorm(),就会生成服从正态分布的随机数。

比如我们生成100个服从正态分布的随机数

rnorm(100)

[1] -9.064408e-01 1.026560e+00 -1.097470e+00 1.055395e+00 9.377175e-01

[6] -2.080103e-01 -3.092396e-01 -8.739942e-01 -1.242774e+00 1.102486e+00

[11] 1.082092e+00 -1.695528e+00 -5.930809e-01 -2.100800e-01 8.253859e-01

[16] -1.112551e+00 -3.960474e-01 -9.354820e-01 7.291608e-01 -3.773510e-01

[21] -3.438082e-01 -7.378688e-02 -9.047609e-01 -1.036344e+00 9.485103e-01

[26] -3.437985e-01 -2.145275e-02 1.350098e+00 -1.283633e+00 3.767240e-01

[31] 1.169566e+00 -4.325399e-01 -9.215626e-02 3.839357e-01 3.045491e-01

......

我们再用相应的频率分布直方图来看一下，这些生成的随机数：

hist(rnorm(100))

R就画出了这些随机数的频率分布图

函数随机数方差方法模型

# 上一篇：Go CSP并发模型

# 下一篇：python的urllib3库(http连接池)

推荐阅读

热门文章

最新发布

标签列表

r_stuio回归函数的程序包是哪个?

给您推荐相同类型的内容：