双重差分模型DID 结果分析

Python012

双重差分模型DID 结果分析,第1张

*第一种DID回归设计

reg y did time treated,r

显然在10%水平上,政策实施有显著的负效应

*第二种DID回归设计

reg y time##treated,r

同样的在第二种方法中,无需设置交互项,结果是一样的

*第三种DID回归设计

**安装外部命令

ssc install diff

**估计DID

diff y, t(treated) p(time)

在第三种方法里,直接使用diff命令,快速实现方法一的三步骤,结果一样

**将以上交互项作为解释变量进行回归

xtreg y time treated Before3 Before2 Before1 Current After1 After2 After3 i.year, fe

est sto reg

CT检验1

可以看出Before3 Before2 Before1 的系数均不显著,After1的系数负向显著

**采用coefplot命令画图

ssc install coefplot

coefplot reg,keep(Before3 Before2 Before1 Current After1 After2 After3) vertical recast(connect) yline(0)

保留关键变量: keep(Before2 Before1 Current After1 After2 After3_)*

转置: vertical*

系数连线,观察动态效果: recast(connect)*

增加直线y=0: yline(0)*

CT检验2

结果发现系数在政策前的确在0附近波动,而政策后一年系数显著为负,但很快又回到0附近。这说明实验组和控制组的确是可以进行比较的,而政策效果可能出现在颁布后一年,随后又很快消失。

对原始时间序列进行检验,此时第二项选level,第三项选None。没通过检验,说明原始时间序列不平稳。

2、对原始时间序列进行一阶差分后再检验,即第二项选1stdifference,第三项选intercept,若仍然未通过检验,则需要进行二次差分变换。

3、二次差分序列的检验,即第二项选择2nddifference,第四项选择Trendandintercept。到此时间序列就平稳了。

第一部分   模型简介

1、模型应用背景

2、模型运用前提条件

3、稳健性检验

第二部分   经典论文分析

1、民族地区转移支付、公共支出差异与经济发展差距

2、基于多期双重差分的分位回归及其应用

第三部分   双重差分模型(DID)stata实例操作

1、变量构造和基本命令

2、平行趋势检验

第四部分   经典论文推荐

第五部分   专题预览

估计政策效应常用的方法有:工具变量法、断点回归、倾向得分匹配法、双重差分法、合成控制法等。我们在这里介绍双重差分法。

第一部分   模型简介

1、模型应用背景

现代计量经济学和统计学的发展为我们的研究提供了可行的工具。倍差法来源于计量经济学的综列数据模型,是政策分析和工程评估中广为使用的一种计量经济方法。主要是应用于在混合截面数据集中,评价某一事件或政策的影响程度。该方法的基本思路是将调查样本分为两组,一组是政策或工程作用对象即“作用组”,一组是非政策或工程作用对象即“对照组”。根据作用组和对照组在政策或工程实施前后的相关信息,可以计算作用组在政策或工程实施前后某个指标(如收入)的变化量(收入增长量),同时计算对照组在政策或工程实施前后同一指标的变化量。然后计算上述两个变化量的差值(即所谓的“倍差值”)。这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。

2、模型运用前提条件

2.1 使用前提

(1)政策不能是“一刀切”类型,即存在受政策影响的实验组和不受政策影响的对照组

(2)至少两年的面板数据,如果是截面数据一般也别考虑了

2.2 模型前提

(1)平行趋势(CT)假设:处理组和对照组有共同趋势,在政策干预之前,处理组和控制组的结果效应的趋势应该是一样的。

(2)SUTVA条件:政策干预只影响处理组,不会对控制组产生交互影响,或者政策干预不会产生外溢效应;

(3)线性形式条件:潜在结果变量同处理变量和时间变量满足线性条件。

由此可见DID的使用条件较为严苛,并不能随意使用。

3、稳健性检验

为了证明所有的效应是由政策实施所引起的,必须做稳健性检验,主要体现在两个方面:

3.1  平行趋势检验

如果是多年面板数据可以通过画图或者回归的方法来检验平行趋势假设。

(1)画图:画出实验组时期和对照组时期的时间趋势图,如果两条线的走势完全一致或基本一致,说明CT假设是满足的。

(2)回归:将模型构造中dt项改为“年份虚拟变量”,政策实施前有a年就有a个年份虚拟变量,以及与du相乘的a个交互项。此时交互项反映的是“政策实施前年份,实验组和对照组的差异”。如果这a个交互项不显著,即说明政策实施前实验组和对照组不存在明显的差别,从而满足CT假设。一般,“都不显著”可以稍微放松,即便存在一两个显著的情况,但只要a个交互项联合不显著,也是满足CT假设。

3.2 安慰剂检验

安慰剂检验核心思想即即虚构处理组进行回归。

第一步:选取政策实施之前的年份进行处理,例如,政策发生在2014年,研究区间为2013-2015年。我们可以把研究区间向前移动到2011-2013年,并假定政策实施年份为2012年,然后进行回归。

第二步:选取已知的并不受政策实施影响的群组作为处理组进行回归。

如果不同虚构方式下的DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。

此外还可以利用不同不同的对照组进行回归,看研究结论是否依然一致。或者选取一个完全不受政策干预影响的因素作为被解释变量进行回归,如果DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。

注:以上如果回归结果显著,说明原结果是一定有问题的,而如果回归结果不显著,并不一定能表明原结果没问题。

第二部分  经典论文分析

1、民族地区转移支付、公共支出差异与经济发展差距

双重差分法DID模型      趋势评分匹配的双重差分法PSM-DID模型

针对民族地区的财政转移支付,是实行财政分权制度的多民族国家缓和民族矛盾、缩小地区差别的重要手段。基于最优政府间转移支付型和“净财政收益”概念,本文首先提出如下理论假说: 这类转移支付有助于减少民族地区与其他地区之间的公共支出差异和经济发展差距。然后使用1993—2003年中国县省两级数据,并采用基于趋势评分匹配的双重差分法( DID with Propensity ScoreMatching) ,检验上述理论假说。研究发现:

(1)中国2000年底实施的民族地区转移支付政策,显著促进了民族地区公共支出水平的相对提高和公共支出结构的相对优化。不过,促进作用未显示出随时间不断增强的态势。

(2)该项政策未显著缩小民族地区与其他地区之间的经济发展差距。本文的研。

究结论表明,民族地区转移支付在中国发挥了均等化效应,但程度有限。

2、基于多期双重差分的分位回归及其应用

VAR 模型   单期双重差分模型    多期双重差分模型(DID)   分位回归方法

针对房价的高速上涨,从2010 年起,中国政府开始采取一系列措施抑制房产泡沫、防止地产被过度炒作。过行政手段抑制需求的“限购令”是否真的抑制了房价的过快上涨?其效果如何?如何进行评估?实证的方法主要有VAR 模型和单期双重差分模型,本文将利用70 个大中城市在三个不同调控期的房地产相关数据,采用多期双重差分模型(DID)动态、精准地分析限购政策的长期动态效果。同时,考虑到70 个大中城市的房价差异非常明显,本文还将采用分位回归方法进一步探索限购令对住宅价格的影响,从而为相关部门制定进一步的房地产调控政策提供理论依据。

将双重差分模型应用到限购对房价的影响问题上,具体思路为:将实施限购的城市作为处理组,将未实施限购的城市作为对照组,时间段分为政策出台前与政策出台后。据此可以设置两个虚拟变量Di 和Dt , Di 代表是否实施了限购令,Dt 代表政策实施前后,若某个城市实施了限购令,则Di = 1 ,否则Di = 0 ;Dt = 1 代表该时间段为某城市实施限购令之前,Dt = 2 代表该时间段为某城市实施限购令之后。据此,两个变量的交互项乘积Di*Dt 即可在一定程度上反应政策的实施效果。在因变量的选择上,本文选择了国家统计局发布的全国70 个大中城市的月度房屋销售价格指数作为研究对象,该指数的计算是基于各地房管局的网签数据,能够较为有效地避免现实交易中出现的阴阳合同问题。控制变量的选取从供求理论出发,以上期的供给量和需求量为控制变量,将供求因素纳入模型从而剔除其对房价造成的影响,直接体现限购对房价的影响效果。通过研读以往研究房价影响因素的文献,由于房地产市场反应不够灵敏,本文认为当期商品住宅需求主要可以从城市的整体经济水平(以上一期城市所在省份的工业增加值同比增长率为指标)以及上一期商品住宅销售面积同比增长率中反映出来,以上一期商品住宅投资额的同比增长率反映供给的基本水平。同时为了更全面地消除城市自身特征(如地理位置、人口因素等)对房价增长率造成的影响,本文将滞后一期的房价同比增长率也作为控制变量。

第三部分  双重差分模型(DID)stata实例操作 

1、变量构造和基本命令

**调用数据

use ' https://dss.princeton.edu/training/panel101.dta', clear

**设置虚拟变量,政策执行时间为1994年

gen time = (year>=1994) &!missing(year)

**生成地区的虚拟变量

gen treated = (country>4) &!missing(country)

**产生交互项

gen did = time*treated

**第一种回归设计

**回归Estimating the DID estimator

reg y time treated did, r

显然在10%水平上,政策实施有显著的负效应。

*第二种DID回归设计

reg y time##treated,r

**方法三下载外部命令方法

ssc install diff

**估计DID

diff y, t(treated) p(time)

2、平行趋势检验

以上的基准回归只有当地区在政策前足够相似才能够保证DID提取的是政策的因果效应,所以研究者需要知道两组地区在政策前有多大差异。实现这一目标的方法是将年份虚拟变量乘以实验组虚拟变量,这一交互项就可以捕捉两组地区在每一年份的差异。如果两组地区的确有着平行趋势的话,那么预期在1994年前的那些交互项的回归结果将不显著,而1994年后的将显著。

**平行趋势检验

**生成年份虚拟变量与实验组虚拟变量的交互项(此处选在政策前后各3年)

gen Dyear = year-1994

gen Before3 = (Dyear==-3&treated==1)

gen Before2 = (Dyear==-2&treated==1)

gen Before1 = (Dyear==-1&treated==1)

gen Current = (Dyear==0&treated==1)

gen After1 = (Dyear==1&treated==1)

gen After2 = (Dyear==2&treated==1)

gen After3 = (Dyear==3&treated==1)

**将以上交互项作为解释变量进行回归

xtreg y time treated Before3 Before2 Before1 Current After1 After2 After3 i.year, fe

est sto reg

可以看出Before3 Before2 Before1 的系数均不显著,After1的系数负向显著采用coefplot命令进行绘图,观察是否1994年前的回归系数均在0轴附近波动,在1994年后回归系数显著为负。

coefplot reg,keep(Before3 Before2 Before1 Current After1 After2 After3) vertical recast(connect) yline(0)

结果发现系数在政策前的确在0附近波动,而政策后一年系数显著为负,但很快又回到0附近。这说明实验组和控制组的确是可以进行比较的,而政策效果可能出现在颁布后一年,随后又很快消失。

第四部分   经典论文推荐

[1]Matching As an Econometric Evaluation Estimator. The Review of EconomicStudies,1998,65(2):261-294.(note:最早提出者)

[2]胡宏伟,“城镇居民医疗保险对国民健康的影响效应与机制”,《南方经济》,2012年第10期

[3]毛捷,“民族地区转移支付公共支出差异与经济发展差距”,《经济研究》,2011年增2期

[4]CompulsoryLicensing:Evidence from the Trading with the Enemy Act,AER,2012

[5]交通基础设施质量与经济增长:来自中国铁路提速的证据,世界经济,2012年第1期

[6]新型农村社会养老保险政策效果评估》,经济学(季刊),2014年第14卷第1期

财政“省直管县”改革与基层政府税收竞争,经济研究,2015年第11期

[7]税收分成、税收努力与企业逃税,管理世界,2016年第12期

[8]政企合谋与企业逃税:来自国税局长异地交流的证据,经济学(季刊),2016年第15卷第4期

[9]出口改善了员工收入吗?,经济研究,2011年第9期

[10]西部大开发:增长驱动还是政策陷阱,中国工业经济,2015年第6期

[