学完陈强计量经济学后学哪本

Python029

学完陈强计量经济学后学哪本,第1张

1)在学多元回归分析,我会先去搜集用SPSS软件实现的相关书籍,选择了张文彤老师的书籍《张文彤SPSS初中级教程》、《张文彤SPSS高级教程》等。

2)在学时间序列分析的时候,会去找EVIEWS软件的书籍,张晓峒老师的《计量经济学软件EViews使用指南》。

3)在学面板数据分析的时候,EVIEWS和STATA的相关书籍,陈强老师的《高级计量经济学及STATA应用》。

4)在学机器学习相关的内容的时候,会去找R语言软件的书籍,吴喜之老师《复杂数据统计方法——基于R的应用》等等。工具类书籍有一个好处,就是提供给我们诸多的案例与算法示例,跟着工具书走一遍,就相当于一道证明题跟着书籍证明了一遍,在流程中掌握更多细节。另外,网络学习资源丰富,这里可以给大家推荐一些,经管之家是一个学习统计计量的好去处,很多人会在其中交流自己的心得以及疑问,很多坛友也都见解独到,让人耳目一新,有利于拓展思路。还有一些网站也比较有特色,小木虫、经济学家、科学网等,预测者网有比较多的股市数据给出的指标还是挺全面的。中文互联网数据资讯中心有比较多的当下热门的网络资讯信息与报告,还有一些大城市除了统计局还有自己的数据服务网,譬如上海市政府数据服务网。

此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。

我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分( 包括证明和正文 )做了修改。

目录

为了将二值模型拓展到多值的情况,我们首先要理解二值选择模型的经济意义。

在上一篇文章的 Probit 和 Logit 模型中似乎看不到扰动项的存在。为此,我们先考察二值选择模型的微观基础。对于二值选择模型,通常可以用一个 潜变量 (latent varibale)来概括该行为的净收益。如果净收益大于 0 则选择做;否则选择不做。假设净收益为:

其中,净收益为潜变量,不可观测。上面的式子也称为 指数函数 ( index function ),个体的选择规则为:

于是:

假设或服从逻辑分布,那么:

其中, 为的累积分布函数,上面的第二个等号用到了密度函数关于原点对称的性质。这个形式与 高级计量14 中的二值选择模型的形式相同,均为:

所以看似不存在的扰动项其实是被包含在分布函数里头了。

另外一种 关键的 微观基础为 随机效用最大化 模型( Random utility Maximization, RUM)。假设选择则可以带来效用;选择则可以带来效用 。如果满足,那么就选 ,记;如果那么就选择记为。由于存在很多决定效用的未知因素以及未来的不确定性,效用方程中包含一个扰动项,故名 随机效用 。假设, 那么:

定义以及,于是又会得到我们前面的表达式: ,说明 潜变量 随机效应最大化模型 虽然尝试从不同的经济意义理解二值选择模型,但最终其表达式是一样的。

在随机效用最大化模型中:

随机效用最大化模型的优点是比较容易推广到多值选择模型,我们下面马上讲解它的应用。

个体面临的选择有时候是多值的,而不仅仅是二值的。比如,交通工具的选择、职业的选择,等等。假设个体的候选方案为,其中。如果,那么多值选择模型退化为二值选择。

使用随机效用法,假设个体选择方案所带来的效用为:

其中,解释变量只随个体而变,不随方案而变。比如,个体的性别、年龄、收入等特征。这种解释变量被称为 只随个体而变 ( case-specific )或 不随方案而变 ( alternative-invariant )。系数带下标,表明对随机效用的作用取决于方案,在概率表达式中,表现为对的 条件概率

显然,当且仅当方案带来的效用高于所有的其他方案,个体才会选择方案。所以个体选择的概率可以写为:

假设为且服从型极值分布,则可证明:

显然,各方案的概率之和为1。上面的方程是对二值选择 Logit 模型的自然推广。需要注意的是,我们无法同时识别所有的系数, 这是因为如果将系数变为 ,完全不会影响模型的拟合。 为此,通常让某个方案(比如方案1)的系数为,即让它成为 参照方案 ( base category ),于是,个体选择方案的概率为:

其中, 所对应的方案为参照方案。此模型称为 多项 Logit ( Multinomial Logit ),可以用 MLE 进行估计,个体的似然函数为:

其中, 为示性函数( indicator function ),即如果括号中的表达式成立,则取值为1;反之取值为0。将所有个体的对数似然函数加总,即得到整个样本的对数似然函数,将其最大化就可以得到参数估计值。

另外,如果在中假设服从维正态分布,则可以得到 多项 Probit ( Multinomial Probit )模型,但该模型的选择概率设计高维积分,不好计算。

其实我们看看教材给的例子就看得懂了:

多项 Logit 模型仅考虑不随方案而变的解释变量(比如,肤色),但有些解释变量可能既随个体而变,也随方案而变,比如,考虑以下的一个情景:

我们把这种解释变量称为 随方案而变 ( alternative-specific ),既包括随方案与个体而变的变量(选择加入不同俱乐部交的会费不同),也包括随方案而变但不随个体而变的变量(选择加入某个俱乐部后在这个俱乐部里每个人的会费相同)。于是,个体选择方案所带来的效用是:

其中,解释变量的下标为表明,解释变量随个体而变,也随方案而变。系数不带下标表明对随机效用的作用不依赖于方案,比如乘车时间依个体与方案的改变而改变,但乘车时间太长所带来的负效用是一致的。

根据多项 Logit 类似的推导可以计算,个体选择方案个概率为:

此模型称为 条件 Logit ( Conditional Logit, CL ),也称为 McFadden 选择模型 ( McFadden's Choice Model),来自于 McFaden 在 1974 年的文章。

条件 Logit 模型的估计方法与多项 Logiot 类似,都通过 MLE 估计以得到系数的估计值,不过在 CL 中,参数不依赖于参照方案,所以也不需要把的某个部分标准化为 0。

字面上理解,混合 Logit 模型就是糅合了 12.2 和 12.3 两种模型的特点而发展来的。很自然地,可以写出个体选择方案所能带来的随机效用:

其中,解释变量既随个体而变,也随方案而变;而解释变量仅随个体而变。经过类似的推导,可以计算出个体选择方案的概率为:

此模型在文献中称为 混合 Logit 模型( Mixed Logit ),但 Stata 仍称之为条件 Logit。为了识别模型,方程中也需要选择一个参照方案,并令。

对于以上三种模型,当方案本身的特质并不重要,或缺乏相关特征的数据时,常常使用多项 Logit 模型。如果需要考虑不同方案的特征,则应使用 条件 Logit 模型 混合 Logit 模型 。另外,在这些多值选择模型中,由于被解释变量的分布必然为 多项分布 ( multinomial distribution ),故一般不必考虑稳健标准误,使用普通标准误即可:这一点类似于二值选择模型。然而,如果数据时 聚类样本 ,则仍需要使用稳健标准误。

需要注意的是,在 多项 Logit 模型 混合 Logit 模型 中,对参数估计值的解释是以参照方案( base category )为转移的(可以根据理论或方便来选择参照方案)。以 多项 Logit 模型 为例,假设“方案1”或“方案 “其中一个必然发生,那么在此条件下,“方案 ”发生的概率为:

上式与二值选择的 Logit 模型具有完全相同的形式。而 几率比 或 相对风险 为:

从条件概率可以看出,该条件概率并不依赖于其他任何方案——换言之, 如果将多值选择模型的任何两个方案单独挑出来,都是二值 Logit 模型 。此假定称为 无关方案的独立性 ( Idependence of Irrelevant Alternatives, IIA)。根据类似的推导,条件 Logit 模型也服从 IIA 假定。然而,在实践中,如果两个不同的方案之间十分接近,那么 IIA 假设不一定成立, 这是多项 Logit、条件 Logit 与混合 Logit 模型存在的通病

如果还是不理解,那么我们可以尝试去理解检验 IIA 的方法:豪斯曼检验,的基本想法:

也就是说,如果 IIA 成立,那么去掉某个方案以后的系数估计与全样本估计值 没有系统性差别,为此 Hausman &McFadden (1984) 提出了以下统计量:

其中, 等于的维度。另外还有 Small &Hsiao (1985) 也提出了检验 IIA 的方法,不过这两个方法的小样本性质都不好,故结论只具有参考价值。

在经历了半年多的云端学习后,想必你早已渴望聆听计量大咖的亲自面授,以及个性化的深度交流。在众多计量小伙伴的千呼万唤下,陈强老师的高级计量及Stata现场班(是的,线下面授!)将于2020年国庆节(10月1-6日)正式回归啦

曾几何时,计量经济学已经成为经济学人(乃至管理,会计,社会科学人)安身立命之法宝。究其原因,如果没有计量经济学,我们就无法从错综复杂的经济与社会现象中识别出可靠的因果关系。

如果你还没想好即将到来的国庆长假应该做什么,不少你的同辈、前辈甚至晚辈都已经计划好了——那就是,给自己充电计量经济学,参加陈强老师的高级计量经济学及Stata六天现场班!