面板门限模型

Python041

面板门限模型,第1张

1、面板单门限模型的设定与估计

经验研究的文章步骤:

1核心变量对被解释变量产生的影响

2稳健性检验(重要)

3机制分析,即核心变量是如何影响被解释变量的

4异质性分析,讨论关键的解释变量在不同条件下对被解释变量的影响变化

异质性分析典型的处理方法:

1加入解释变量的二次项,观察解释变量和被解释变量之间是否存在U型或者倒U型关系。

2交互项

3分组回归

上述做法可能导致的问题:

高度共线性

如何分组的主观性问题

设定N和门限值时就会把核心解释变量分为N+1组,目前最多为3门限模型,因为分组过多往往会导致结果的不一致性。此时寻找门限值的方法为:先利用残差平方和最小原来寻找到,然后在的基础上寻找的值,此时的值是一直有效的,但是不一致的,所以需要在通过已经确定的来从新寻找新的的值。

对多门限模型的检验与单门限模型类似,只是这是的原假设为存在单门限效应,备则假设为存在双门限效应。因此也可以看出,在拟用双门限效应时,我们应首先引入单门限效应,然后在进一步考虑是否需要引入双门限效应模型。

4、xthreg命令介绍及应用

xthreg为固定效应面板门限模型的stata命令。该命令只能处理平衡面板数据模型下的面板效应。rx(varlist)放体制依赖变量,即我们所要探究的核心解释变量。qx(varname)放门限变量,即异质性因素变量。thnum(#)放门限数,最多为3. grid(#)格杉点数,默认为300. trim(numlist)为头寸处理,一般选取0.01,另外注意,有多少门限数,就应对应几个头寸处理。bs(numlist)为自助抽样的次数,一般默认为300. thlevel()设定置信水平,一半为95%,gen(newvarname)按照门限变量生出新的虚拟变量,thgiven表示可以根据之前的拟合结果继续增加门限数拟合,可缩短计算时间。notes表示命令的可接受L.*的写法生成滞后变量。

研究投资对现金流的敏感性是否受到融资约束的影响为例。

i为被解释变量,q为托宾Q值,c为核心解释变量,d为融资约束。

tabstat i q1 c1 d1, s(min p25 p50 p75 max) format(%6.3f) c(s)

主要变量的描述性统计。

xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(1) grid(400) trim(0.01) bs(300)

由第一张图可知,其门限值为0.0154,下行为门限效应的检验,可见P值为0.0000,远小于0.01,因此拒绝线性模型的原假设,认为存在单门槛效应。最后从回归结果中可知,低组别下(融资约束较低时现金流对投资约束的影响),对应系数为0.056,高组别下(融资约束较高时现金流对投资约束的影响),对应的系数为0.086.符合预期,即融资约束较高时,企业很难从外部获得投资所需要的资金,所以企业投资时更多依赖与内部现金流。

进一步,引入虚拟时间变量,即双向固定效应下的单门限效应模型的结果。

xi:xthreg i q1 q2 q3 d1 qd1 i.year, rx(c1) qx(d1) thnum(1) grid(400) trim(0.01) bs(300)

可以看到,门限值没有发生改变,仍为0.0154,估计结果的系数也只是发生轻微变化。接下来估计门限值的一致性,可通过画出似然比函数图像和a=0.05时对应水平线下的图像来确定门限值的一致性。

_matplot e(LR), columns(1 2) yline(7.35, lpattern(dash)) connect(direct) msize(small) mlabp(0) mlabs(zero) ytitle("LR Statistics") xtitle("Threshold") recast(line) name(LR)

上图可知,LR<7.35的值在区间0.0154之间,且0.0154时LR为0,所以认为该门限值具有一致性。

在引入单门限模型后,进一步考虑是否需要进一步引入多门限模型。

xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(3) grid(400) trim(0.01 0.01 0.05) bs(0 300 300) thgive

三个门限值分别为0.0154,0.5418,0.4778。模型的检验结果可知,单门限模型和双门限模型均可通过检验,而三门限模型未能公通过检验。

模型下的回归结果如图所示,除了最高组别的系数下降以外,其他系数均随着组别上升而上升。接下来对门限值的一致性进行检验。

_matplot e(LR21), columns(1 2) yline(7.35, lpattern(dash)) connect(direct) msize(small) mlabp(0) mlabs(zero) ytitle("LR Statistics") xtitle("First Threshold") recast(line) name(LR21) nodraw 

 _matplot e(LR22), columns(1 2) yline(7.35, lpattern(dash)) connect(direct) msize(small) mlabp(0) mlabs(zero) ytitle("LR Statistics") xtitle("Second Threshold") recast(line) name(LR22) nodraw

_matplot e(LR3), columns(1 2) yline(7.35, lpattern(dash)) connect(direct) msize(small) mlabp(0) mlabs(zero) ytitle("LR Statistics") xtitle("Third Threshold") recast(line) name(LR3) nodraw

graph combine LR21 LR22 LR3, cols(1)

可见,前两个门限值的LR图都是平滑有规律的,而第三个门限的LR图像则显得杂乱无章,所以第三个门限未能通过显著性检验。综上可知,该模型不存在三门限效应,而是双门限效应,所以我们还应该报告双门限效应的估计结果。

xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(2) grid(400) trim(0.01 0.01) bs(300 300)

最后我们发现最高组的现金流对投资的影响反而低于中间组现金流对投资的影响,这似乎不符合理论预期,对该问题的解决或许应找到更好的衡量融资约束的指标。

参考资料:方红生教授,面板数据分析与stata应用

多层回归模型通常涉及到对同一个体进行反复测量,这样得到的数据就不再相互独立而是存在某种相关性,所以普通线性回归不再适用。当这种反复测量是在不同时点上进行时,这就称为面板数据分析(panel data analysis)或者纵向数据分析(longitudinal data analysis)。