线性回归 - 要考虑的指标?

数据挖掘 回归 线性回归 公制
2022-02-11 12:11:55

在评估线性回归模型时,我们需要考虑 R 平方或均方误差的哪个指标(或者哪个需要更重要)?

谢谢你。

1个回答

Aditya已经在评论中正确提到,因此在评估线性回归模型时首选 RMSE、MSE 或 MAE。因此,为了回答您的问题,我将提供使用 RMSE 和 MAE 的优缺点,并进一步提出为什么不首选 R-squared 的一些观点。

1. MAE 与 RMSE - 哪个指标更好?

理想情况下,这取决于模型的损失函数,最常见的是 L2 - 欧几里德距离(您也可以创建自己的损失函数)。RMSE 对较大的误差赋予相对较高的权重。它不一定随着误差的方差而增加,而是随着误差幅度的频率分布的方差而增加。而MAE相对稳定。

通常情况下,对远离均值的点给予更高的权重会更有意义,在该平均值中,RMSE 是首选的。在偏离平均值任何幅度都会受到同等惩罚的情况下,MAE 将是首选。

在计算不同大小的测试样本时,RMSE 可能会很麻烦(训练模型时就是这种情况)。随着测试样本量的增加([RMSE] ≤ [MAE * sqrt(n)]),RMSE 有越来越大于 MAE 的趋势。

2. R平方没用吗?(有点苛刻,但对不起不是对不起)

保持简短和简单。

  • R-squared 不测量拟合优度。
  • R-squared 不测量预测误差。
  • R-squared 不允许您使用转换后的响应来比较模型。
  • R 平方不衡量一个变量如何解释另一个变量。