需要加权均方误差

数据挖掘 机器学习 喀拉斯 回归 评估 模型选择
2022-02-10 15:46:00

我们将 MSE 和 RMSE 作为回归问题的评估指标。对于一些问题,人们使用加权均方误差 (WMSE) 作为评估指标。

以下是 WMSE 公式: 在此处输入图像描述 谁能解释一下 WMSE 的真正需求以及何时不使用 MSE。

提前致谢。

2个回答

加权 MSE 是一种在总分中对某些预测错误给予比对其他预测错误更重要的方法。如果您使用 MSE 作为模型的性能指标,这很有用,尤其是在模型训练(损失函数)或验证(超参数设置)期间。

在您引用的案例中,点击次数较多的案例更为重要。如果您将此 WMSE 用作验证的性能指标,则与使用 MSE 相比,您的模型在点击次数较多的情况下往往会更好。


请注意您的示例:使用的平方误差((predictedClicksobservedClicks)2) 是一个绝对平方误差(我本来预计是一个相对误差),因此已经随着点击次数的增加而增加。因此,在这种情况下,以这种方式加权可以增强点击次数较多的情况下的性能。

我正遇到这个问题。我正在研究负载和吞吐量之间的相关性。字面上的(负载,吞吐量)对。但是,如果您测量的是通常负载为 1000 的实际系统,您可能永远无法获得负载为 1、2、3 等低值的负载数据(即:Google 仅在 1 个用户时的吞吐量是多少?我们永远不会获取数据。)所以,我想做的是正确权衡我拥有的所有数据。在观察到的数据中,每个观察值都有一个权重,基本上就是将其包含在 MSE 中的次数。我无法对“负载 1 时的 Google 吞吐量”进行观察,因为这永远不会发生。

这意味着 MSE 的方程需要适当的权重。仔细想想,做统计一般都是这样的!如果您测量 f(20)=100 1000x,但仅测量 f(5)=2.3 2x,而 f(1) 从未实际测量过……那么,在费率中。即:说它是字节/秒......保持单独的字节和持续时间计数。如果发生两次,您必须以 2.3 字节/秒的速度测量 2 次。