按照书上所说就是:“
若图形存在非线性,则说明你可能对预测变量的函数形式建模不够充分,
那么就需要添加一些曲线成分,比如多项式项,或对一个或多个变量进行变换(如用log(X)代
替X),或用其他回归变体形式而不是线性回归。
”
按照别人的说法就是:看图中的两条线,红色虚线和绿色实线是否接近。接近了就说明模型是线性的(这是在RStudio中做出的成分残差图)。
框内的数字是行变量和列变量之间的相关系数R,相关系数R绝对值越大,颜色越深(红正,蓝负)。统计学中,P值越小相关性越显著,一般来说 一个*代表显著相关(P值为0.01,选取不同参数可能不一样)、两个**代表极显著相关(P值为0.001)、三个***代表极极显著相关(P值为0.0001). 图中还可以看出,相关系数R的绝对值0.67(变量P50与T之间)以上的都显著相关,至少一个*。符合一般关于相关系数R值的显著性统计。