R语言学习DAY04:回归分析

Python011

R语言学习DAY04:回归分析,第1张

R本身是一门统计语言,主要用于统计分析,前面的语法部分算是基础,接下来开始进入统计模型应用。首先从最常用的回归分析说起。

有关线性回归分析模型的基本假定需要注意:1)关于随机干扰项的高斯-马尔科夫定理;2)关于自变量的:不存在共线性;3)关于模型的:模型设定正确。

用 glm 函数建立广义线性模型,用参数 family 指定分布类型,logistic模型指定为binomial

用 predict 函数进行预测, predict(model, data, type = 'response'

此外,还可以用 mlogit 包中的 mlogit 函数做多分类变量logistic回归, rms 包中的 lrm 函数做顺序变量logistic回归, glmnet 包中的 glmnet 函数做基于正则化的logistic回归

打开R,注意要把该安装的函数包都安装一下,然后用nls函数做非线性回归

例如:估计非线性回归统计模型

步骤:

#读取数据并查看

f<-read.csv(file="D:/XXX.csv")

f

#做出x与y之间的散点图

plot(f$y~f$x)

#利用nls函数估计β1、β2

nls(f$y~1/(β1+β2*exp(-f$x)),data=f,start=list(β1=1,β2=1))

#添加非线性回归线

y<-f$y

x<-f$x

f<-function(β1,β2,x){1/(β1+β2*exp(-x))}

f.1<-function(x){f(带入估计出的β1,β2,x)}

curve(f.1,add=T,col="red")