quantreg 分位数回归
MASS BOX-COX变换
survival 生存函数、COX比例危险回归模型
mfp COX比例危险回归模型多重分数多项式
car 可以检查vif
ridge 岭回归
lars lasso回归
msgps adaptive lasso
pls 偏最小二乘
横截面数据 回归机器学习 方法
rpart.plot 画回归树
mboost boosting回归
ipred bagging回归
randomForest 随机森林回归
e1071 or kernlab SVR支持向量机回归
nnet+caret or neuralnet 神经网络
横截面数据 分类 经典方法
glm( ) 广义线性模型
MASS 的 lda( ) or mda 的 mda( ) or fda 的 fda( ) 线性判别
横截面数据 分类机器学习 方法
rpart.plot 画分类树
adabag adaboost分类、bagging分类
randomForest 随机森林分类
e1071 or kernlab SVR支持向量机分类
kknn 最近邻分类
nnet 神经网络分类
横截面数据 计数或有序因变量
Possion 散布问题(方差不等于均值):
dglm 双广义线性模型(Tweedie分布)
MASS 的 glm.nb( ) (负二项分布)
pscl 的 zeroinfl( ) 零膨胀计数数据模型
rminer 支持向量机
mlogit 多项logit模型
MASS 的 loglm( ) or nnet 的 multinom( ) 多项分布对数线性模型
MASS 的 polr( ) or VGAM 的 vglm( ) 多项分布对数线性模型
纵向数据:多水平模型、面板数据
lme4 的 lmer( ) or nlme 的 lme( ) 线性随机效应混合模型
REEMtree 拟合固定效应部分的决策树
coxme cox随机效应分析
JM 联合模型
plm 拟合面板数据
多元分析
factanal( ) 因子分析
cluster 分层聚类
ICGE INCA指数
ggmap 画地图
NbClust 一系列聚类方法
CCA 典型相关分析
MASS 对应分析
以下为非经典多元数据分析
FactoMineR 主成分分析、对应分析(补充元素作为测试集);多重对应分析(可以包含数量变量和分类变量)、多重因子分析、分层多重因子分析、基于主成分分析的分层聚类
多元数据的关联规则分析
arules 关联规则分析
路径建模数据的PLS分析
plspm 的函数 plspm( ) 偏最小二乘
lavvan 加协方差关系
应该说是应用比较广的一种数据科学语言。R语言的优点:
1. 免费... 开源... (这也是SAS流行于公司,R流行于研究机构和大学的最主要原因)
2. 是专门为统计和数据分析开发的语言,各种功能和函数琳琅满目,其中成熟稳定的一抓一把
3. 语言简单易学。虽与C语言之类的程序设计语言已差别很大(比如语言结构相对松散,使用变量前不需明确正式定义变量类型等等),但仍保留了程序设计语言的基础逻辑与自然的语言风格。
4. 小... 安装程序只有50Mb左右, 因为体积轻便,运行起来系统负担也小。
5. 同各种OS的兼容性好。
6. 因为用的人越来越多,又是开源,有很多配套的“插件”为其锦上添花。
R语言可以使用spatstat包中的spatstat.geom()函数来实现地理加权回归投影。spatstat.geom()函数接受一个经纬度矢量作为参数,然后根据给定的经纬度坐标,计算出一组投影坐标。这些投影坐标可以用于地理加权回归分析。