目标检测模型的性能上下跳跃

数据挖掘 深度学习 张量流 物体检测
2022-03-12 14:53:45

我正在训练一个模型来从非洲农村的卫星图像中检测建筑物。对于标签,我使用 OpenStreetMap 几何图形。我使用 Tensorflow 对象检测 API 和 SSD Inception V2 作为模型。我在两个不同的数据集(在不同的地理区域)上训练了单独的模型。在一个领域,模型学习并安静地快速收敛:

卡龙加_f1

但是,在其他区域训练模型时,会发生这种情况:

塔博拉

请注意,我使用完全相同的模型、配置、批量大小、训练区域的大小等。在第二种情况下,模型的预测变化非常迅速,我不明白为什么。例如,下面是模型在 107k 和 108k 全局步长下的预测的比较:

预测

我对深度学习很陌生,无法理解为什么会发生这种情况。我将非常感谢任何提示,等等。这可能是我忽略的一些简单的事情。

让我知道我是否应该提供更多信息

0个回答
没有发现任何回复~