t值、F值与R方的区别?F值和P值关系

Python014

t值、F值与R方的区别?F值和P值关系,第1张

t值是对单个变量显著性的检验,t值的绝对值大于临界值说明该变量是显著的,要注意的是t检验是对总体当中变量是否是真正影响因变量的一个变量的检验,即检验总体中该变量的参数是否为零,只不过总体中变量的参数永远未知,只能用其无偏估量(参数的样本估计量)来代替进行检验.

F值是对所有解释变量整体显著性的检验,其原假设是所有的解释变量的参数都为零,而只要其中至少有一个解释变量的参数不为零就说明解释变量在整体上对因变量有显著性的影响,但仅依靠F检验是无法判断究竟哪个自变量对因变量有显著性的影响,必须进一步对每一个变量进行t检验。

R平方值表明了模型对样本数据的拟合程度,其值越高说明模型对样本数据拟合得更好,要注意R平方值是样本依赖的,就是说R平方值判别模型的一个潜在的假设是你所抽取的样本是真正来自于你所研究的总体,而现实当中这一点往往难以做到。我们进行计量经济分析的最终目的是要依据样本数据来研究总体的规律性,那么相应的检验也是要对总体进行,而R平房值的高低仅代表模型对样本数据的拟合程度,并不能说明总体当中变量的显著性,虽然F统计量和R平方值有换算关系,但是二者的构造机理是完全不同的,包括t检验都是针对总体的检验,所以在现实中我们一般不对R平方值的大小给与太大的关注,而更看重 t检验 的结果,试想如果你抽取的一组样本不是来自于你真正要研究的对象的总体,即使R平方值再高、那也说明不了问题。

首先来说明各个符号,B也就是beta,代表回归系数,标准化的回归系数代表自变量也就是预测变量和因变量的相关,为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差。T值就是对回归系数的t检验的结果,绝对值越大,sig就越小,sig代表t检验的显著性,在统计学上,sig<0.05一般被认为是系数检验显著,显著的意思就是你的回归系数的绝对值显著大于0,表明自变量可以有效预测因变量的变异,做出这个结论你有5%的可能会犯错误,即有95%的把握结论正确。

回归的检验首先看anova那个表,也就是F检验,那个表代表的是对你进行回归的所有自变量的回归系数的一个总体检验,如果sig<0.05,说明至少有一个自变量能够有效预测因变量,这个在写数据分析结果时一般可以不报告

然后看系数表,看标准化的回归系数是否显著,每个自变量都有一个对应的回归系数以及显著性检验

最后看模型汇总那个表,R方叫做决定系数,他是自变量可以解释的变异量占因变量总变异量的比例,代表回归方程对因变量的解释程度,报告的时候报告调整后的R方,这个值是针对自变量的增多会不断增强预测力的一个矫正(因为即使没什么用的自变量,只要多增几个,R方也会变大,调整后的R方是对较多自变量的惩罚),R可以不用管,标准化的情况下R也是自变量和因变量的相关

标准误表示由于抽样误差所导致的实际值和回归估计值的偏差大小,标准误越小,回归线的代表性越强

希望对您有用