为什么要平方RR给出解释的方差?

机器算法验证 回归 相关性 r平方
2022-01-17 22:14:34

这可能是一个基本问题,但我想知道为什么R回归模型中的值可以简单地平方以给出解释方差的数字?

我明白那个R系数可以给出关系的强度,但我不明白如何简单地平方这个值给出解释方差的度量。

对此有什么简单的解释吗?

非常感谢您提供帮助!

2个回答

挥手,相关性R可以被认为是两个向量之间角度的度量,依赖向量Y和独立向量X. 如果向量之间的角度是θ, 相关性Rcos(θ). 的一部分Y这是由X有长度Ycos(θ)并且平行于(或上的投影)。未解释的部分长度为并且与正交。在方差方面,我们有 其中右边的第一项是解释方差和其次是无法解释的差异。因此,解释的分数是,而不是XYXYsin(θ)X

σY2=σY2cos2(θ)+σY2sin2(θ)
R2R

您可以长期这样做,并证明因变量的总方差是预测方差和误差方差的总和。方差或预测与因变量方差的比率称为,在 OLS 中介于 0 和 1 之间。发生这种情况时,当您只有一个自变量时,皮尔逊相关系数。这就是为什么你可以说相关系数的平方给出了解释的方差,即预测方差与总方差的部分。R2R2=R