有关线性回归分析模型的基本假定需要注意:1)关于随机干扰项的高斯-马尔科夫定理;2)关于自变量的:不存在共线性;3)关于模型的:模型设定正确。
用 glm 函数建立广义线性模型,用参数 family 指定分布类型,logistic模型指定为binomial
用 predict 函数进行预测, predict(model, data, type = 'response'
此外,还可以用 mlogit 包中的 mlogit 函数做多分类变量logistic回归, rms 包中的 lrm 函数做顺序变量logistic回归, glmnet 包中的 glmnet 函数做基于正则化的logistic回归
基于R语言实现Lasso回归分析主要步骤:
将数据存成csv格式,逗号分隔
在R中,读取数据,然后将数据转成矩阵形式
加载lars包,先安装
调用lars函数
确定Cp值最小的步数
确定筛选出的变量,并计算回归系数
具体代码如下:
需要注意的地方:
1、数据读取的方法,这里用的file.choose( ),这样做的好处是,会弹出窗口让你选择你要加载进来的文件,免去了输入路径的苦恼。
2、数据要转为矩阵形式
3、(la) 可以看到R方,这里为0.66,略低
4、图如何看? summary的结果里,第1步是Cp最小的,在图里,看到第1步与横轴0.0的交界处,只有变量1是非0的。所以筛选出的是nongyangungun
Ps: R语言只学习了数据输入,及一些简单的处理,图形可视化部分尚未学习,等论文写完了,再把这部分认真学习一下~~在这里立个flag