逻辑回归一般的数学公式是:
y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...))
以下是所使用的参数的说明:
y 是响应变量。
x 是预测变量。
a 和 b 是数字常量系数。
用于创建回归模型的功能是 glm()函数。
语法
glm()函数在逻辑回归的基本语法是:
glm(formula,data,family)
以下是所使用的参数的说明:
formula 是呈现所述变量之间的关系的标志。
data 在数据集给出这些变量的值.
family 为R对象以指定模型的细节。它的值是二项分布
R本身是一门统计语言,主要用于统计分析,前面的语法部分算是基础,接下来开始进入统计模型应用。首先从最常用的回归分析说起。有关线性回归分析模型的基本假定需要注意:1)关于随机干扰项的高斯-马尔科夫定理;2)关于自变量的:不存在共线性;3)关于模型的:模型设定正确。
用 glm 函数建立广义线性模型,用参数 family 指定分布类型,logistic模型指定为binomial
用 predict 函数进行预测, predict(model, data, type = 'response'
此外,还可以用 mlogit 包中的 mlogit 函数做多分类变量logistic回归, rms 包中的 lrm 函数做顺序变量logistic回归, glmnet 包中的 glmnet 函数做基于正则化的logistic回归
logit=glm(y~x1+x2,data=data,family=binomial(link='logit'))glm表示广义线性回归,data表示y,x1,x2所在的数据集,family中的link用来选择回归类型,logit表示选择logistic回归