使用 SVM 时使用哪种性能度量:MSE 还是 MAE?

机器算法验证 预测模型 支持向量机
2022-04-11 21:03:45

通过计算MSE(均方误差)来衡量 SVM 模型的性能是一种常见的做法。为什么不使用平均绝对误差(平均误差的绝对值而不是平方值)?

3个回答

实际上,查看 MAE 和 RMSE 可以为您提供有关错误分布的更多信息:

MAERMSEMAE2(用于回归)

  • 如果RMSE接近MAE, 模型犯了很多相对较小的错误
  • 如果RMSE接近MAE2, 模型的错误很少但很大

性能指标的选择取决于对您感兴趣的应用程序的重要性。对于许多应用程序来说,MSE 是一个很好的性能指标,因为有充分的理由假设噪声过程是高斯的。如果您不希望您的性能指标对异常值过于敏感,有时最好使用 MAE。本质上,如果不了解应用程序的性质,就没有正确的性能指标。

另一方面,我并不太热衷于支持向量回归,因为通常有关于响应变量中噪声分布的知识,如果我们将这些专家知识构建到模型中,我们可能会获得更好的数据模型出模型。这就是为什么我们有 GLM,而不仅仅是对所有事情都使用最小二乘回归。SVM 中使用的损失函数对这种性质没有非常清晰的统计解释。SVM 回归还使用基于错误的最坏情况界限的损失函数,因此,如果您使用本质上是平均情况统计的性能指标,那么这表明您应该改用基于平均情况的模型性能而不是最坏的情况(例如 GLM)。

MAE 比 MSE 更直观,可以简单地评估整体误差。

MSE 更容易在数学上处理方差分析。例如,MSE 用于计算误差方差se2,这是回归统计中的重复值。