解释均方根误差 (RMSE)!

数据挖掘 机器学习 回归 损失函数
2021-10-13 03:28:44

我阅读了所有关于 RMSE 与其他绝对误差(即平均绝对误差 (MAE))的优缺点。请参阅以下参考资料:

我仍然无法理解有关 RMSE 的信息:

场景:假设我们有一个预测房价的回归器,其 MAE 为 20.5 $,RMSE 为 24.5 $基于 MAE,我当然可以解释为预测价格与实际价格之间的平均差异为 20.5美元如何解释 RMSE?基于 RMSE(预测误差的上限),我们仍然可以安全地说预测价格和实际价格同时相差 24.5美元吗?

在第一篇中等帖子中,它说:

RMSE 不单独描述平均误差,并且具有更难以梳理和理解的其他含义。

这让我有点困惑。而且我找不到任何可靠的参考来明确指出人们可以安全地将 RSME 解释为 MAE。RMSE 是否只是在数学上更便于优化等,我们最好使用 MAE 进行解释?

任何详细的解释都非常感谢。

2个回答

如何解释 RMSE?

RMSE 正是定义的内容。24.5 美元是您的预测与实际观察之间的平方差平均值的平方根。正如您可能从经典线性回归中学到的那样,在统计数据中,平方差比绝对差更常见。

这让我有点困惑。而且我找不到任何可靠的参考来明确指出人们可以安全地将 RSME 解释为 MAE。RMSE 是否只是在数学上更便于优化等,我们最好使用 MAE 进行解释?

我认为这篇文章应该对你有所帮助。我会直接回答你的问题:

  • RMSE 在数学上和实践上都更容易。你听说过导数吗?当您的预测等于观察值时,MAE 的导数未定义,但 RMSE 的任何地方都已明确定义。在机器学习中,定义良好的梯度函数通常更好。
  • RMSE 和 MAE 都很有用,但它们是两个非常不同的指标。在回归中,通常是在线性回归和分位数回归之间进行选择。他们是两个非常不同的模型!
  • 如链接中所述,如果您不希望残差过多影响模型,MAE 可能会更好。否则,如果您的数据集定义明确(残差不多),则 RMSE 可能会更好。

哪个更好,没有对错之分。像两种不同的建模算法一样思考。

均方根误差 (RMSE)是残差的标准偏差(预测误差)。残差衡量回归线数据点的距离;RMSE 是衡量如何分散这些残差的方法。换句话说,它告诉您数据在最佳拟合线附近的集中程度。

评估回归模型与数据集的拟合程度的一种方法是计算均方根误差,这是一个指标,它告诉我们模型的预测值与数据集中的实际值之间的平均距离。

RMSE 越低,给定模型越能“拟合”数据集

查找有关如何通过示例解释均方根误差 (RMSE)的详细说明。