quantreg 分位数回归
MASS BOX-COX变换
survival 生存函数、COX比例危险回归模型
mfp COX比例危险回归模型多重分数多项式
car 可以检查vif
ridge 岭回归
lars lasso回归
msgps adaptive lasso
pls 偏最小二乘
横截面数据 回归机器学习 方法
rpart.plot 画回归树
mboost boosting回归
ipred bagging回归
randomForest 随机森林回归
e1071 or kernlab SVR支持向量机回归
nnet+caret or neuralnet 神经网络
横截面数据 分类 经典方法
glm( ) 广义线性模型
MASS 的 lda( ) or mda 的 mda( ) or fda 的 fda( ) 线性判别
横截面数据 分类机器学习 方法
rpart.plot 画分类树
adabag adaboost分类、bagging分类
randomForest 随机森林分类
e1071 or kernlab SVR支持向量机分类
kknn 最近邻分类
nnet 神经网络分类
横截面数据 计数或有序因变量
Possion 散布问题(方差不等于均值):
dglm 双广义线性模型(Tweedie分布)
MASS 的 glm.nb( ) (负二项分布)
pscl 的 zeroinfl( ) 零膨胀计数数据模型
rminer 支持向量机
mlogit 多项logit模型
MASS 的 loglm( ) or nnet 的 multinom( ) 多项分布对数线性模型
MASS 的 polr( ) or VGAM 的 vglm( ) 多项分布对数线性模型
纵向数据:多水平模型、面板数据
lme4 的 lmer( ) or nlme 的 lme( ) 线性随机效应混合模型
REEMtree 拟合固定效应部分的决策树
coxme cox随机效应分析
JM 联合模型
plm 拟合面板数据
多元分析
factanal( ) 因子分析
cluster 分层聚类
ICGE INCA指数
ggmap 画地图
NbClust 一系列聚类方法
CCA 典型相关分析
MASS 对应分析
以下为非经典多元数据分析
FactoMineR 主成分分析、对应分析(补充元素作为测试集);多重对应分析(可以包含数量变量和分类变量)、多重因子分析、分层多重因子分析、基于主成分分析的分层聚类
多元数据的关联规则分析
arules 关联规则分析
路径建模数据的PLS分析
plspm 的函数 plspm( ) 偏最小二乘
lavvan 加协方差关系
R是不断更新的一个工具,里面的扩展包的使用是和R的版本还有byte相关的,所以这里根据你的报错信息来看, 你要检查一下你的R版本,保证在3.2以上能够使用这个扩展包.
R里的复杂扩展包一般都是有依赖包存在的,一般使用install.packages命令会让R也同时自动下载依赖包,这里你没有提供依赖包下载信息,默认应该都被自动下载好了.
另外一种情况就是R并不下载依赖包,但是在使用library()命令时也会加载一些其他包来使目标包可以被加载成功,这时会有warning信息.
非常好学。输入几行代码,即可得到结果。R不但数据分析好用,而且作图能力极好,推荐你用。
下面是R数据分析的一些代码,包括数据导入、方差分析、卡方测验、线性模型及其误差分析。希望可以帮到你:
1.1导入数据
install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
head(a)显示前六行
class(a$y)/str(a)查看列/全集数据类型
a$y=as.numeric(a$y)转换数据类型
1.2方差分析(F test)
with(a,tapply(liqi,tan,shapiro.test))正态性检验
library(car)leveneTest(liqi~tan,a)方差齐性检验
q=aov(liqi~tan*chong,a)方差分析(正态型)
summary(q)
TukeyHSD(q)多重比较
1.3卡方测验(Pearson Chisq)
a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))卡方检验(逻辑型/计数型)
aa=a1$y
aaa=matrix(a2,ncol=2)
aaa= as.table(rbind(c(56,44), c(36,64), c(48,52),c(58,42)))
dimnames(aaa)= list(group=c("不添加抗性","不添加敏感","添加抗性","添加敏感"),effect=c("存活","死亡"))
aaa=xtabs(data=a,~x+y)
chisq.test(a)误差分析(卡方测验,Pearson法)
install.packages("rcompanion")
library(rcompanion)
pairwiseNominalIndependence(a)多重比较
1.4线性模型及其误差分析(Wald Chisq)
q=lm(data=a,y~x1*x2)一般线性模型(正态性)
summary(q)
q=glm(data=a,y~x1*x2,family = gaussian(link='identity'))广义线性模型(正态性)
summary(q)
q=glm(data=a,y~x1*x2,family = binomial(link='logit'))广义线性模型(逻辑型,二项分布)
summary(q)
q=glm(data=a,y~x1*x2,family = poisson(link='log'))广义线性模型(计数型,泊松分布)
summary(q)
install.packages('lmerTest')一般线性混合效应模型(正态性)
library(lmerTest)
install packages(‘lme4’)
library(lme4)
q=lmer(data=a,y~x1*(1|x2))
q=lmer(data=a,y~x1*(1|x2),family = gaussian(link='identity'))广义线性混合效应模型(正态性)
q=glmer(data=a,y~x1*(1|x2),family = binomial(link='logit'))广义线性混合效应模型(逻辑型,二项分布)
q=glmer(data=a,y~x1*(1|x2),family = poisson(link='log'))广义线性混合效应模型(计数型,泊松分布)
summary(q)
install.packages('car')
install.packages('openxlsx')
library(car)
install.packages('nlme')
library(nlme)
Anova(q,test='Chisq')线性模型的误差分析(似然比卡方测验,Wald法)
lsmeans(q,pairwise~chuli,adjust = "tukey")线性模型的多重比较(tukey法)