协方差本身没啥子用,但他是相关系数的计算的垫脚石。
分母是x和y的标准差之积,目的是将结果调整到[-1,1]范围内,不受原始数值大小的影响,只反映趋势
表示相关系数是否具有统计显著性。
随着样本数量的增多,p值逐渐会变小。但如果样本之间的相关系数小,增加样本数量也不能使预测更加准确,仅仅增加对预测结果的信心。(此时弹幕有一句非常应景的话: 我很有信心的说不知道!!O(∩_∩)O )
在R语言中有相关性检验的函数,可以给出p值
在这里,r是相关系数,R2是r的平方(并不是适用于所有情况)。可用于说明x可以解释百分之多少的–y的变异–
lm是线性拟合的函数,可以计算出来方程:
这个结果的意思是方程为y = -0.11 + 1.84* x
那么可以计算出每个x对应的预测值(es):
也可由此计算R2。
R2 = 拟合直线解释的变异(VAR(mean)-VAR(line))占均值变异(VAR(mean))的百分比。
R2=0.78,表示由x和y的关系解释的变异占y值总体变异的78%(大部分)。
在R语言中无需自己计算,直接在模型的summary信息中就有
如此枯燥,你都看到了现在。我在搜索R语言如何计算R2的时候翻到了一个宝藏函数,出自ggpmisc包,可以将公式与R2添加到图上去~
esrequre <- function(x){ #求标准差平方估计值sum <- 0
sum0 <- 0
for(i in 1:length(x)){
sum0 <- residu[i]^2
sum <- sum + sum0}
residusqure <- sum/(length(x)-2)
residusqure}
ester <- sqrt(esrequre(x))ester #标准差估计值(回归分析表给出的标准误差)
ZRE <- residu / esterZRE #标准化残差
满意请采纳。