r语言 逻辑回归 实例自变量有多个

Python015

r语言 逻辑回归 实例自变量有多个,第1张

辑回归是回归模型,其中响应变量(因变量)具有明确的值,如:True/False或0/1。 它实际测量二元响应作为响应变量,是基于与预测变量有关它的数学方程的值的概率。

逻辑回归一般的数学公式是:

y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...))

以下是所使用的参数的说明:

y 是响应变量。

x 是预测变量。

a 和 b 是数字常量系数。

用于创建回归模型的功能是 glm()函数

语法

glm()函数在逻辑回归的基本语法是:

glm(formula,data,family)

以下是所使用的参数的说明:

formula 是呈现所述变量之间的关系的标志。

data 在数据集给出这些变量的值.

family 为R对象以指定模型的细节。它的值是二项分布

R本身是一门统计语言,主要用于统计分析,前面的语法部分算是基础,接下来开始进入统计模型应用。首先从最常用的回归分析说起。

有关线性回归分析模型的基本假定需要注意:1)关于随机干扰项的高斯-马尔科夫定理;2)关于自变量的:不存在共线性;3)关于模型的:模型设定正确。

用 glm 函数建立广义线性模型,用参数 family 指定分布类型,logistic模型指定为binomial

用 predict 函数进行预测, predict(model, data, type = 'response'

此外,还可以用 mlogit 包中的 mlogit 函数做多分类变量logistic回归, rms 包中的 lrm 函数做顺序变量logistic回归, glmnet 包中的 glmnet 函数做基于正则化的logistic回归

logit=glm(y~x1+x2,data=data,family=binomial(link='logit'))

glm表示广义线性回归,data表示y,x1,x2所在的数据集,family中的link用来选择回归类型,logit表示选择logistic回归