求问Breusch-Pagan的检验的原理和操作方法。

Python013

求问Breusch-Pagan的检验的原理和操作方法。,第1张

1、Breusch-Pagan的检验原理是:

因为异方差具有线性形式,假设解释变量前的系数不全为0,则模型是异方差的。

因此,Breusch-Pagan检验就是对辅助回归进行方程的显著性检验,可以构造F统计量。

2、Breusch-Pagan的操作方法:

(1)Goldfeld-Quandt检验:

1、首先我们要将观测值按照解释变量x的大小顺序排列。

2、其次将排在中间部分的c个(约n/4)观测值删去,再将剩余的观测值分成两个部分(每个部分的个数分别为n1和n2)。

3、然后分别对上述两个部分的观测值进行回归,之后求两个部分的回归残差平方和。

4、构造F统计量,F=[e2'e2/(n2-k)]/[e1'e1(n1-k)],其中 k为模型中被估参数个数。

在H0成立条件下,判别规则是:

若F≥Fα(n2 - k, n1 - k), 接受H0(具有同方差);

若 F >Fα(n2 - k, n1 - k), 拒绝H0(递增型异方差)  。

【注意】:

① 当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。                    

② 此法只适用于递增型异方差。

(2)、图示检验法:用回归的残差的平方2ie作为纵坐标,以回归式中的某一个解释变量ix为横坐标,画散点图。

如果散点图呈现出一定的趋势,则可以判断存在异方差。  

扩展资料:

异方差性是计量经济学术语。

指回归模型中扰动项的方差不全相等。假设线性回归模型中,扰动项 ε 的分量是均值为零,彼此独立的,但不全相等,在这种情况下。OLS 估计虽然具有无偏性和一致性,却不是最优线性无偏估计。

因此在预测时 波动较大,为此,在应用 OLS 方法之前要对模型的异方差性进行检验,并设法消除异方差性。

若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数估计量不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数进行有关显著性检验。

对存在异方差性的模型可以采用加权最小二乘法进行估计。

异方差性的检测——White test

在此检测中,原假设为:回归方程的随机误差满足同方差性。

对立假设为:回归方程的随机误差满足异方差性。

判断原则为:如果nR2>chi2 (k),则原假设就要被否定,即回归方程满足异方差性。

在以上的判断式中,n代表样本数量,自由度为k(解释变量的个数)。

chi2(卡方统计)值可查表所得。

含义

回归模型的随机扰动项ui在不同的观测值中的方差不等于一个常数,Var(ui)常数(i=1,2,…,n),或者Var(ui) ,Var(uj)(i,j=1,2,…,n),这时我们就称随机扰动项ui具有异方差性(Heteroskedasticity)。

在实际经济问题中,随机扰动项ui往往是异方差的,但主要在截面数据分析中出现。

例如:

(1)、调查不同规模公司的利润,发现大公司的利润波动幅度比小公司的利润波动幅度大。

(2)、分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。

在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;

异方差性破坏了古典模型的基本假定,如果我们直接应用最小二乘法估计回归模型,将得不到准确、有效的结果。

来源

1、模型中缺少某些解释变量,从而随机扰动项产生系统模式。

由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。

如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。

例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装、食品等)的需求,设其模型为:其中Qi表示对某一消费品的需求量,Ii为家庭收入,ui为随机扰动项。

ui包括除家庭收入外其他因素对Qi的影响,如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得Qi偏离均值的程度。

在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平Ii,Qi偏离均值的程度是不同的,Var(ui)常数,于是就存在异方差性了。

异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。

比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。

2、测量误差

测量误差对异方差性的作用主要表现在两个方面:

一方面,测量误差常常在一定时间内逐渐积累,误差趋于增加,如解释变量X越大,测量误差就会趋于增大。

另一方面,测量误差可能随时间变化而变化,如抽样技术或收集资料方法的改进就会使测量误差减少。

所以测量误差引起的异方差性一般都存在于时间序列中。

例如,研究某人在一定时期内学习打字时打字差错数Yt与练习打字时间Xt之间的关系。

显然在打字练习中随时间的增加,打字差错数将减少,即随着Xt的增加Yt将减小。

这时Var(ut)将随Xt的增加而减少,于是存在异方差性。

不仅在时间序列上容易出现异方差性,利用平均数作为样本数据也容易出现异方差性。

因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同。

一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即Var(ui)随收入Ii呈现先降后升的趋势,这也存在着异方差性。

3、模型函数形式设置不正确

模型函数形式的设定误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势。

4、异常值的出现

随机因素的影响,如政策变动、自然灾害、金融危机、战争和季节等。

类型

异方差一般可归结为三种类型:

(1)、单调递增型:随X的增大而增大,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越大

(2)、单调递减型:随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越小

(3)、复杂型:与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。

检验存在的方法

事实也证明,实际经济问题中经常会出现异方差性,这将影响回顾模型的估计、检验和应用。

因此在建立计量经济模型时应检验模型是否存在异方差性。

关于异方差性检验的方法大致有:图示检验法、Goldfeld - Quandt 检验法、White检验法、Park检验法和Gleiser检验法。

后果

在古典回归模型的假定下,普通最小二乘估计量是线性、无偏、有效估计量,即在所有无偏估量中,最小二乘估计量具有最小方差性——它是有效估计量。

如果在其他假定不变的条件下,允许随机扰动项ui存在异方差性,即ui的方差随观测值的变化而变化,这就违背了最小二乘法估计的高斯——马尔柯夫假设,这时如果继续使用最小二乘法对参数进行估计,就会产生以下后果:

1、参数估计量仍然是线性无偏的,但不是有效的。

2、异方差模型中的方差不再具有最小方差性。

3、t检验失去作用。

4、模型的预测作用遭到破坏。

补救措施:

对模型变换,当可以确定异方差 的具体形式时,将模型作适当变换有可能消除或减轻异方差的影响。

加权最小二乘法,对原模型变换的方法与加权二乘法实际上是等价的,可以消除异方差。

买模型的对数变换,运用对数变换能使测定变量值的尺度缩小。

它可以将两个数值之间原来10倍的差异缩小到只有2倍的差异。

其次,经过对数变换后的线性模型,其残差e表示相对误差,而相对误差往往比绝对误差有较小的差异。

参考资料

百度百科-量化投资:以R为工具

百度百科-异方差

Matlab 和 C++,一个建模一个执行,足够了。实在不爱用Matlab的话,R和Python也行。多看书多学习,英语也是很重要的。可以找视频和书籍学习。

个人推荐《量化投资:以python为工具》主要讲解量化投资的思想和策略,并借助Python 语言进行实战。《量化投资:以Python为工具》一共分为5 部分,第1 部分是Python 入门,第2 部分是统计学基础,第3 部分是金融理论、投资组合与量化选股,第4 部分是时间序列简介与配对交易,第5 部分是技术指标与量化投资。《量化投资:以Python为工具》首先对Python 编程语言进行介绍,通过学习,读者可以迅速掌握用Python 语言处理数据的方法,并灵活运用Python 解决实际金融问题;其次,向读者介绍量化投资的理论知识,主要讲解量化投资所需的数量基础和类型等方面;最后讲述如何在Python 语言中构建量化投资策略。

一说到量化投资,一下子蹦出来一堆厉害的语汇,例如:FPGA,微波加热,高频率,纳秒等级延迟时间这些。这种全是高频交易中的语汇,高频交易的确是基金管理公司做起来较为适合,平常人搞起来门槛较为高。

可是,必须确立一点量化投资不相当于高频交易。买卖假如依据频率来区划的话,可分成:高频率:ticke纳秒等级的1s等级中低频:1s~2h等级超低频:1d~2w等长线投资高频交易对延迟时间,特性和可靠性规定十分高,必须很多的硬件配置的成本费和人力成本。

可是中低频买卖对硬件配置规定便会低许多。本人与基金管理公司差别关键反映在优化算法上,普通程序也是有工作能力捕捉到这一频率的买卖数据信号。老头子废话不多说,就一个字,立即干!假如要想剖析A股,或是BTC,就必须自身构建一套自然环境。

一般构建一个量化平台必须这种流程:设立账户〉开发工具构建〉数据信息提前准备〉量化交易策略开发设计〉回归测试〉模拟交易〉实盘买卖一、设立账户(这里忽略)

一、开发工具构建现阶段流行的两种服务平台是,python和R语言。这两个语言表达有给予回测架构,时间序列分析剖析,数据分析的库,(C+和java还可以,但是门槛相对性较为高)。

Python:现阶段应该是最广泛的本人量化分析技术性优选 语言表达,由于有关的开源框架非常丰富多彩。R:高级优化算法较为便捷,小区较为活跃性。我选择的是Python,常见的回测架构用的是ZipLine和BackTrader。

二、数据信息提前准备中国的股票数据,有一些服务提供商给予,例如通联数据、tushare;海外证券数据信息能够从得这种数据信息后就可以导到数据库查询去。有关数据库查询的挑选,一般应用Mysql,假如信息量较为大(>100G)能够应用mogodb,一般本人不容易这么大信息量。

三、量化交易策略开发设计说到买卖优化算法,通常会想到深度学习、马尔可夫实体模型、数据分析、深度神经网络、神经元网络等这种厉害的AI语汇,可是,一般游戏玩家基本上用不上。

针对一般投资者能够采用简易高效率的优化算法:

1、将自身实际操作和念头程序化交易,例如:三连阳,买低价股票或是你听闻过什么神奇的实际操作技巧全是用编码完成,随后应用历史记录开展回测。

2.传统式的指标值买卖:移动平均线,MACD,布林线指标等,蜡烛图基础理论,RSI,江恩理论。这种纯技术指标分析指标值必须在特殊的情景才可以有功效,大家都听闻过海龟交易法,很有可能都觉得挺有些道理的。但具体情况怎样,用A股或是外汇数据测试一下,便会发觉长期性回报率并不是特别好。

3.多因子选股票:每一个投资者都是有自身的选股票基础理论,例如有些人会看市净率,股票换手率,市净率,领域状况,交易量。这种挑选要素非常简单,但要是以好几千个股里去挑选,通常必须很多活力。程序流程就能特别好处理这种难题。如果你是高级玩家还可以试着一下高级优化算法。

例如深度学习,数据分析等。互联网大数据在金融投资行业运用或是处在逐渐环节。从现阶段信息内容看来,互联网大数据基金收益率的算是非常好,例如百度搜索和广发证券协作的百发指数型基金,腾讯官方和嘉实协作的互联网大数据股票基金。

四、回归测试假如回测实际效果非常好,回报率,最大回撤率,Sharp值,等指标值,都是在可接纳的范畴内容,你毫无疑问便会激动,急着要上真正买卖,乃至逐渐方案创立私募投资基金,可是,别着急,最好是模拟交易一下。

五、模拟交易但在实盘买卖前,还必须做一两个月模拟交易。许多回测实际效果非常好的对策不一定在模拟交易情况下就主要表现得好。历史记录是固定不动,回测的情况下能够根据持续调节主要参数,让各类指标值趋向极致,有时会造成优化算法过度拟合,由于销售市场一直千姿百态,太过于呆板的优化算法是没法融入销售市场转变。

模拟交易最后实际效果一般在于你的程序流程是不是灵便,是不是优良的风险性和资金分配优化算法。

总结:对于说本人做量化投资是不是可靠,上边的步骤早已表明了实际可策划方案,可靠性显而易见。对于能否赚到钱,就看本人的修为了更好地。