请教大神,R语言做logistic回归的结果OR

Python029

请教大神,R语言做logistic回归的结果OR,第1张

变量通过不检验有以下这些可能:

1、方程本身没有意义,比如我们用身高来预测性别,这个肯定通不过检验。2、自变量本省有问题,二项逻辑回归对自变量的要求比较严,一般是要求连续、正态分布的数据才可以。如果自变量不满足符合的条件则很有可能通不过检验。

解决的方式:

1、首先将你的自变量转化为Z分数,这样可以从一定程度上改善数据的分布。针对情况1、你先用点二列相关检验一下看看各个转化后自变量和因变量之间是不是存在相关关系,如果不相关的话后面的步骤就免了。

2、如果两者存在相关再重新用二项逻辑回归进行拟合,如果通过检验则万事大吉,如果还是不行则往下看。

3、如果不能通过检验则说明通过转化为Z分数起到的效果有限,这个时候可以用Multinomnal logistic,这个在SPSS15以上的版本有,对自变量要求不是很严,可以是等级变量和分类变量。

1、coeff:指的是回归系数。

std.err指的是估计标准误,p值就是显著性,95%CI就是回归系数95%的置信区间。

2、RDOR:是叫相对诊断比值比(relative diagnostic odds ratios,RDOR)。

当RDOR>1.0,表明某个研究特征比没有这个特征的诊断准确性要高。

扩展资料:

分析最主要看你标的3的那个表格里,coef下面是系数,std是标准差。

例如:

第一列,ss 从上到下分别代表 回归平方和(ESS)、残差平方和(RSS)、总离差平方和(TSS) 第二列为自由度。

2分别为观测值、F值、P{P>F}值、R^2、调整后的R^2 、残差标准差hatδ,可以看调整后的R^2,但影响不大。,P值=0,说明不是联合显著。

3第一列为参数值, 第二列为标准误,一般在输出结果时要在参数下用括号写出标准误。第三列为t值,第四列为P值,看它是否显著应先看t在临界值之内还是之外、再看P值。t值全都小于1.96,好像是在95%的显著水平上不显著的吧。最后两列表示95%的置信区间。

逐步回归的R语言实现

定义类型

向前引入法

从一元回归开始,逐步增加变量,使指标值达到最优为止

相互删除法

从全变量回归方程开始,逐步删去某个变量,使指标值达到最优为止

逐步筛选法

综合上述方法

衡量标准

R2:越大越好

AIC:越小越好

step()

usage:

step(object, scope, scale = 0,

direction = c("both", "backward", "forward"),

trace = 1, keep = NULL, steps = 1000, k = 2, ...)

这个函数可以用来对已建立的lm or glm model进行逐步回归分析。

其中,direction分为”both”, “backward”, “forward”,分别表示逐步筛选、向后、向前三种方法。

注意,这个函数筛选的依据是AIC,而不是R2。

example:

最后

鉴于step()有时候会出现莫名其妙的错误,因此再介绍一个可以做逐步回归的手工方法。

add1()

drop1()