R2和MSE之间的数学关系是什么?

机器算法验证 回归 r平方
2022-03-01 22:20:53

为了理解这种关系,我在一个电子邮件组中遇到了这个对话:

我在使用 NN 分析数据时遇到了问题。我的 R 平方为 0.45,MSE 约为 5000。所以我想知道为什么?R平方和MSE之间一定有关系吗?

R2 = 1 - SSE/SS0

SSE = N*MSE SS0 = (N-1)*VAR(目标)

VAR(T) = SS0/(N-1) = [SSE/(1-R2)]/(N-1)

= [N/N-1]*MSE/(1-R2)

~ 5000/0.55 ~ 9091

如果您将目标标准化为单位方差,您将获得 MSE ~ 0.55

那是对的吗?在理解这种关系时,我们可以获得哪些见解?

1个回答

是的,请允许我详细说明。

回想一下,对于某些结果yiR,i=1,2,..,n我们定义 MSE 和R2作为

MSE(y,y^)=1ni=1n(yiyi^)2

R2(y,y^)=1i=1n(yiyi^)2i=1n(yiy¯)2

所以,正如你所指出的,R2是 MSE 的标准化版本,我们使用 MSE 进行报告,因为我认为它是一个简单的度量标准,从技术上讲,它是我们在求解正规方程时最小化的损失函数。

R2很有用,因为它通常更容易解释,因为它不依赖于数据的规模。

作为一个具体的例子,考虑两个模型:一个预测收入,另一个预测年龄,R2将更容易说明哪个模型表现更好。*


*一般来说,这不是一个好主意,你不应该比较像这样的指标R2跨越不同的模型来做出这些声明,因为有些事情从根本上说比其他事情更难预测(例如,股票市场与泰坦尼克号幸存者)。