在评估线性回归模型时,我们需要考虑 R 平方或均方误差的哪个指标(或者哪个需要更重要)?
谢谢你。
在评估线性回归模型时,我们需要考虑 R 平方或均方误差的哪个指标(或者哪个需要更重要)?
谢谢你。
Aditya已经在评论中正确提到,因此在评估线性回归模型时首选 RMSE、MSE 或 MAE。因此,为了回答您的问题,我将提供使用 RMSE 和 MAE 的优缺点,并进一步提出为什么不首选 R-squared 的一些观点。
1. MAE 与 RMSE - 哪个指标更好?
理想情况下,这取决于模型的损失函数,最常见的是 L2 - 欧几里德距离(您也可以创建自己的损失函数)。RMSE 对较大的误差赋予相对较高的权重。它不一定随着误差的方差而增加,而是随着误差幅度的频率分布的方差而增加。而MAE相对稳定。
通常情况下,对远离均值的点给予更高的权重会更有意义,在该平均值中,RMSE 是首选的。在偏离平均值任何幅度都会受到同等惩罚的情况下,MAE 将是首选。
在计算不同大小的测试样本时,RMSE 可能会很麻烦(训练模型时就是这种情况)。随着测试样本量的增加([RMSE] ≤ [MAE * sqrt(n)]),RMSE 有越来越大于 MAE 的趋势。
2. R平方没用吗?(有点苛刻,但对不起不是对不起)
保持简短和简单。