我正在研究Decision Tree算法,最后我RMSE根据实际标签和预测值(用于回归)计算值。现在我遇到的困难是理解RMSE我得到的价值的重要性。我知道RMSE模型的性能越低越好,但什么RMSE值被认为是合理的低或高?假设我的RMSE价值是20这样的,这是否意味着我的模型的性能是80%(意味着 80% 的预测是正确的)?
RMSE 对机器学习中模型的性能有何看法?
数据挖掘
机器学习
表现
2021-09-20 12:24:38
2个回答
有多个因素需要考虑,但首先要意识到的是,在回归中,您不想考虑一个示例是“正确”还是“不正确”,而是它与真实目标值的接近程度。因此,您可以忽略“80% 的预测是'正确'”的原始直觉。
其次,请记住RMSE与您的目标值在同一空间中。因此,它与目标值的差异有关。随机猜测的基准应该让您获得RMSE = standard_deviation. 所以低于这个,你的模型展示了一些学习能力;超过这个数字,你甚至还没有学会正确猜测平均值。
与其他指标一样,在 RMSE 空间中,“我的模型表现良好”没有界限。一切都与天真的解决方案/基准或最先进的技术有关。
均方根误差 (RMSE) 是一种常用的衡量模型预测值(样本值和总体值)与实际观察值之间差异的度量。如果你建立了一个好的模型,你的训练集和测试集的 RMSE 应该非常相似。如果测试集的 RMSE 远高于训练集的 RMSE,则您可能严重过度拟合数据。
其它你可能感兴趣的问题