相关性系数和它的朋友们

Python014

相关性系数和它的朋友们,第1张

协方差本身没啥子用,但他是相关系数的计算的垫脚石。

分母是x和y的标准差之积,目的是将结果调整到[-1,1]范围内,不受原始数值大小的影响,只反映趋势

表示相关系数是否具有统计显著性。

随着样本数量的增多,p值逐渐会变小。但如果样本之间的相关系数小,增加样本数量也不能使预测更加准确,仅仅增加对预测结果的信心。(此时弹幕有一句非常应景的话: 我很有信心的说不知道!!O(∩_∩)O

在R语言中有相关性检验的函数,可以给出p值

在这里,r是相关系数,R2是r的平方(并不是适用于所有情况)。可用于说明x可以解释百分之多少的–y的变异–

lm是线性拟合的函数,可以计算出来方程:

这个结果的意思是方程为y = -0.11 + 1.84* x

那么可以计算出每个x对应的预测值(es):

也可由此计算R2。

R2 = 拟合直线解释的变异(VAR(mean)-VAR(line))占均值变异(VAR(mean))的百分比。

R2=0.78,表示由x和y的关系解释的变异占y值总体变异的78%(大部分)。

在R语言中无需自己计算,直接在模型的summary信息中就有

如此枯燥,你都看到了现在。我在搜索R语言如何计算R2的时候翻到了一个宝藏函数,出自ggpmisc包,可以将公式与R2添加到图上去~

esrequre <- function(x){ #求标准差平方估计值

sum <- 0

sum0 <- 0

for(i in 1:length(x)){

sum0 <- residu[i]^2

sum <- sum + sum0}

residusqure <- sum/(length(x)-2)

residusqure}

ester <- sqrt(esrequre(x))ester #标准差估计值(回归分析表给出的标准误差)

ZRE <- residu / esterZRE #标准化残差

满意请采纳。