我认为这是一个直截了当的问题,尽管为什么或为什么不背后的原因可能不是。我问的原因是我最近编写了自己的 RF 实现,虽然它表现良好,但表现不如我预期的那么好(基于Kaggle 照片质量预测竞赛数据集、获胜分数和一些有关使用了哪些技术的后续信息)。
在这种情况下,我做的第一件事是为我的模型绘制预测误差,因此对于每个给定的预测值,我确定偏离正确目标值的平均偏差(或偏差)。对于我的射频,我得到了这个情节:

我想知道这是否是 RF 普遍观察到的偏差模式(如果不是,那么它可能是特定于数据集和/或我的实现的东西)。我当然可以使用此图来通过补偿偏差来改进预测,但我想知道 RF 模型本身是否存在更基本的错误或缺陷需要解决。谢谢你。
== 附录 ==
我的初步调查是在这个博客条目随机森林偏差 - 更新