为什么不使用 R 平方来衡量预测准确性?

机器算法验证 预测 r平方 准确性 毫秒
2022-03-26 19:44:01

为什么在文献中通常使用 MAD、MSE、RMSE、MAPE 等常见的精度度量。为什么不使用(确定系数)?R2

我在考虑不同之处:通过使用 MSE,我可以比较预测的平均值。当使用时,我会得到关于方差的信息。R2

为什么最常用的是平均值比较?有人可以给我一个提示吗?

1个回答

样本内 不是预测准确度的合适度量,因为它没有考虑过拟合。总是可以建立一个复杂的模型来完美地拟合样本中的数据,但不能保证这样的模型在样本外表现得很好。R2


样本外 ,即预测值和实际值之间的平方相关性,是有缺陷的,因为它没有考虑到预测中的偏差。R2

例如,考虑实现的价值

yt+1,,yt+m

和两个相互竞争的预测:

y^t+1,,y^t+m

y~t+1,,y~t+m.

现在假设

y~t+i=c+y^t+i

对于每个,其中是一个常数。也就是说,预测是相同的,只是第二个比高。这两个预测通常会有不同的 MSE、MAPE 等,但将是相同的。iccR2

考虑一个极端情况:第一个预测是完美的,即对于每个此预测的将为 1(非常好)。然而,其他预测的也将是 1,即使预测对于每个的偏差。y^t+i=yt+iiR2R2ci