看R语言建立回归分析,如何利用VIF查看共线性问题

Python013

看R语言建立回归分析,如何利用VIF查看共线性问题,第1张

方法/步骤

1、首先,先教大家如何使用SPSS多元线性回归分析

2、接下来是范例说明:

此案例是希望找到与营收相关的多元回归式

原先加入参数有:5个

调整後回归R方:0.888 / 显着性:皆小於0.05

看起来相当拟合,无任何差错

3、可依个人需求,勾选需要参考的指标

若是没有勾选,只会出现既定标准的指标

在此需加入 Statistisc中的 "共线性诊断"

4、排除共线性强因子,可用偏相关查看是否确实应该排除

主要是看 VIF值是否大於2 (大於2,表示共线性极强需改善)

否则会有交互作用

5、最後模型拟合程度,可在excel中

做主次座标清楚检视

在数学上,回归模型变量的VIF等于总模型方差与仅包含该独立变量的模型方差之比。为每个自变量计算该比率。

容忍度的倒数,VIF越大,显示共线性越严重。经验判断方法表明:当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性.

自变量x的方差膨胀因子记为VIF,它的计算方法为:VIF =(1-R^2)-1

式中,R^2是以xj为因变量时对其它自变量回归的复测定系数。

一般认为,如果最大的VIF超过10,常常表示多重相关性将严重影响最小二乘的估计值。

扩展资料:

当多重共线性严重时,应采取适当的方法进行调整。容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性。容忍度这个变量回归系数的估计值不够稳定,则回归系数的计算值也会有很大误差。方差膨胀系数是容忍度的倒数,VIF越大,表示自变量的容忍度越小,越有共线性问题。

参考资料来源:百度百科-方差膨胀系数