随机森林回归的过度拟合结果

数据挖掘 机器学习 Python scikit-学习 随机森林 准确性
2022-03-08 15:54:16

我有一个图像,每个像素包含 4 个不同的值。我使用 RF 来查看是否可以根据每个像素的其他 3 个值预测第 4 个值。为此,我使用了 python 和 scikit 学习。首先我拟合了模型,在验证它之后我用它来预测这个图像。我很高兴也很害怕看到我的模型得到了非常高的准确率:99.95%!但是当我看到结果图像时,它绝对不是 99.95% 的准确度:

原图:

在此处输入图像描述

结果图像:

在此处输入图像描述

(我认为最大和最明显的区别是)。

我的问题是 - 当可视化很好地表明准确性要低得多时,为什么我会获得如此高的准确性?我知道它可能来自过度拟合,但是如何没有检测到这种不同?

编辑:平均绝对误差:0.048246606512422616 均方误差:0.00670919112477127 均方根误差:0.0819096522076078 精度:99.95175339348758

1个回答

您在哪里评估算法的性能?

您是否正在进行火车测试拆分并在测试拆分中进行评估?可能是您过度安装了您的火车,而您只是在测量那里的准确性。

如果您正确地进行了训练/测试拆分和评估,则可能是您预测的图像与您正在训练的图像不具有相同的属性/配置/拓扑