为什么是R2R2模型解释的数据的总方差的比例?

机器算法验证 回归 方差 拟合优度
2022-03-26 03:35:45

我有这个R2=1RSSi=1n(YiY¯)2. 还,RSS=i=1n(YiYi^)2对于只有截距项的最简单的线性模型。我也知道1ni=1n(YiY¯)2是仅截距模型的总方差,并且RSS1ni=1n(YiY¯)2大约是var. of modelvariance.

但是我仍然不明白为什么R2是模型解释的数据的总方差的比例。

2个回答

你的方程式有错误,RSS=(YiY^i)2

也许不看这么多方程式来理解会有所帮助。

RSS是残差方差之和,基本上是模型无法解释的所有方差之和。

所以 RSS(YiY¯)2unexplained varianceSum of all variance

所以

1unexplained varianceSum of all variance=Sum of all varianceunexplained varianceSum of all variance=explained varianceSum of all variance

这有帮助吗?

我们有TSS=i(YiY¯)2, RSS=i(YiY^i)2, ESS=i(Y^iY¯)2

TSS- 总方差,RSS- 剩余方差,ESS- 回归方差

从方差分析身份我们知道

TSS=RSS+ESS

所以我们有R2=1RSSTSS=ESSTSS. 从最后一个方程你可以清楚地看到R2说明回归解释了多少“方差”