机器算法验证 - 为什么不使用 R 平方来衡量预测准确性？ - 吾爱随笔录

机器算法验证预测 r平方准确性毫秒前

2022-03-26 19:44:01

为什么在文献中通常使用 MAD、MSE、RMSE、MAPE 等常见的精度度量。为什么不使用（确定系数）？ $R^2$

我在考虑不同之处：通过使用 MSE，我可以比较预测的平均值。当使用时，我会得到关于方差的信息。 $R^2$

为什么最常用的是平均值比较？有人可以给我一个提示吗？

1个回答

样本内 不是预测准确度的合适度量，因为它没有考虑过拟合。总是可以建立一个复杂的模型来完美地拟合样本中的数据，但不能保证这样的模型在样本外表现得很好。 $R^2$

样本外 ，即预测值和实际值之间的平方相关性，是有缺陷的，因为它没有考虑到预测中的偏差。 $R^2$

例如，考虑实现的价值

y_{t + 1}, \dots, y_{t + m}

$y_{t+1},\dotsc,y_{t+m}$

和两个相互竞争的预测：

{\hat{y}}_{t + 1}, \dots, {\hat{y}}_{t + m}

$\hat{y}_{t+1},\dotsc,\hat{y}_{t+m}$

和

{\tilde{y}}_{t + 1}, \dots, {\tilde{y}}_{t + m} .

$\tilde{y}_{t+1},\dotsc,\tilde{y}_{t+m}.$

现在假设

{\tilde{y}}_{t + i} = c + {\hat{y}}_{t + i}

$\tilde{y}_{t+i}=c+\hat{y}_{t+i}$

对于每个，其中是一个常数。也就是说，预测是相同的，只是第二个比高。这两个预测通常会有不同的 MSE、MAPE 等，但将是相同的。 $i$ $c$ $c$ $R^2$

考虑一个极端情况：第一个预测是完美的，即对于每个。此预测的将为 1（非常好）。然而，其他预测的也将是 1，即使预测对于每个的偏差。 $\hat{y}_{t+i}=y_{t+i}$ $i$ $R^2$ $R^2$ $c$ $i$

其它你可能感兴趣的问题