如果我们要使用平均绝对误差来判断预测准确性,我不明白为什么中位数是最佳估计值背后的直觉。假设你有一个随机变量你想预测接下来会发生什么是。让我们将您的预测表示为 d。
在均方误差下,即:
我们知道预期 MSE 或 MSE 之和在以下情况下最小化等于平均值或. 这在直觉上是有道理的。随机变量的最佳预测指标是其均值。
但是,在平均绝对误差下,即:
预期的 MAE 或 MAE 的总和最小化等于随机变量的中位数。虽然我正在阅读的这本书有一个精美的证据来说明为什么会出现这种情况,但直觉上我不明白为什么中位数会是最好的预测指标。我也不明白为什么平均值(或中位数)不是两者的最佳选择。