RMSE 与 RMSLE
均方根误差 (RMSE) 和均方根对数误差 (RMSLE) 都是找出机器学习模型预测值与实际值之间差异的技术。
但是,RMSLE(“对数”)的目的是什么?
高 RMSE 是否意味着低 RMSLE?
有人可以解释 RMSE 和 RMSLE 之间的详细区别吗?以及该指标如何在幕后工作?
- 什么时候会使用 RMSE 而不是 RMSLE?
- 与 RMSLE 相比,使用 RMSE 有哪些优点/缺点?
均方根误差 (RMSE) 和均方根对数误差 (RMSLE) 都是找出机器学习模型预测值与实际值之间差异的技术。
但是,RMSLE(“对数”)的目的是什么?
高 RMSE 是否意味着低 RMSLE?
有人可以解释 RMSE 和 RMSLE 之间的详细区别吗?以及该指标如何在幕后工作?
- 什么时候会使用 RMSE 而不是 RMSLE?
- 与 RMSLE 相比,使用 RMSE 有哪些优点/缺点?
让我们从定义开始:
其中是目标值,例如和是模型的预测。这两个指标都量化了预测误差,因此通常高 RMSE 也意味着高 RMSLE。
RMSLE 有相对误差的意思,而 RMSE 是绝对误差。选择一个取决于您的问题的性质。想象一下,目标值的范围从大约 1 到大约 100。对于真正的是否与对于一样糟糕?那么 RMSLE 可能是一个不错的选择。另一方面,对于 RMSE,对于 y = 1 预测与对于一样糟糕。
通常,您通常希望对跨越大范围的严格正目标使用对数(或者可能是平方根或其他一些幂
RMSE 将对其值产生异常值的巨大影响。但是在 RMSLE 的情况下,我们可以将异常值的影响降低许多数量级,并且它们的影响要小得多。
RMSLE 值将只考虑预测值与实际值之间的相对误差,而忽略数据规模。但是,如果误差范围增加,则 RMSE 值的幅度会增加。例如
Actual value = 100
Predicted Value = 90
RMLSE: 0.1053
RMSE: 10
Actual value = 1000
Predicted Value = 900
RMSLE: 0.1053
RMSE : 100
此外,在 RMSLE 低估的情况下,结果也会受到很大影响。因此可以很容易地理解,在某些情况下它比 RMSE 更好,但 RMSE 更适合泛化情况。最后 RMSLE 比 RMSE 好一点,但仅基于某些情况。