1.录入原始数据。如图所示,原始数据一般采用excel表格来录入,第一列为决策单元序列,比如公司、行业等;后续各列依次是产出和投入变量,切忌产出变量一定要在投入变量前面。
2.分析效率情况。如图所示,将原始数据的格式进行统一调整之后,导入deap分析软件中,设定好相应的程序和命令后,即可运行出数据分析的结果。其中firm是公司序号,crste是技术效率,vrste是纯技术效率,scale是规模效率,最后一列是规模报酬的状态,irs是规模报酬递增,drs是规模报酬递减,-是规模报酬不变。
3
2.分析冗余情况。如图所示,DEA数据分析结果会分别给出投入、产出的冗余量,其中产出冗余数值是表示产出少了多少,而投入冗余则是表示投入多了多少。
4
4.分析参考单元。如图所示,peers表示的是可以作为效率改进参照的公司序号。由结果可见,5和13的决策单元的效率值为一,这样其他公司以此作为参照,对投入产出量进行调整,便可实现DEA有效。
*第一种DID回归设计
reg y did time treated,r
显然在10%水平上,政策实施有显著的负效应
*第二种DID回归设计
reg y time##treated,r
同样的在第二种方法中,无需设置交互项,结果是一样的
*第三种DID回归设计
**安装外部命令
ssc install diff
**估计DID
diff y, t(treated) p(time)
在第三种方法里,直接使用diff命令,快速实现方法一的三步骤,结果一样
**将以上交互项作为解释变量进行回归
xtreg y time treated Before3 Before2 Before1 Current After1 After2 After3 i.year, fe
est sto reg
CT检验1
可以看出Before3 Before2 Before1 的系数均不显著,After1的系数负向显著
**采用coefplot命令画图
ssc install coefplot
coefplot reg,keep(Before3 Before2 Before1 Current After1 After2 After3) vertical recast(connect) yline(0)
保留关键变量: keep(Before2 Before1 Current After1 After2 After3_)*
转置: vertical*
系数连线,观察动态效果: recast(connect)*
增加直线y=0: yline(0)*
CT检验2
结果发现系数在政策前的确在0附近波动,而政策后一年系数显著为负,但很快又回到0附近。这说明实验组和控制组的确是可以进行比较的,而政策效果可能出现在颁布后一年,随后又很快消失。
主成分分析和探索性因子分析是两种用来探索和简化多变量复杂关系的常用方法。主成分分析(PCA)是一种将数据降维技巧,它将大量相关变量转化成一组很少的不相关变量,这些无相关变量称为主成分。
探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。
R基础安装包提供了PCA和EFA的函数,分别是princomp()和factanal()。本章重点介绍psych包中提供的函数,该包提供了比基础函数更丰富和有用的选项。
最常见步骤
1、数据预处理,在计算前请确保数据没有缺失值;
2、选择因子模型,是选择PCA还是EFA,如果选择EFA,需要选择一种估计因子模型,如最大似然法估计;
3、判断要选择的主成分/因子数目;
4、选择主成分/因子;
5、旋转主成分/因子;
6、解释结果;
7、计算主成分或因子得分。
加载psych包
library(ggplot2)
library(psych)
展示基于观测特征值的碎石检验、根据100个随机数据矩阵推导出来的特征值均值、以及大于1的特征值准则(Y=1的水平线)
fa.parallel(USJudgeRatings[, -1], fa = "pc", n.iter = 100, show.legend = FALSE, main = 'Scree plot with parallel analysis')
对数据USJudgeRatings进行主成分分析
pc<-principal(USJudgeRatings[, -1],nfactors=1)
pc