如果同一网络(CNN 模型)的两次不同迭代的性能差异很大,这意味着什么?

数据挖掘 机器学习 卷积神经网络 物体识别
2022-02-20 05:47:52

因此,我在 caltech-pedestrian 数据集上训练了用于人员检测的 CNN 模型:然后我很好奇并在评估工具箱的每 1000 次迭代中评估了该模型(我保证评估中没有错误)。

不过,剧情的表现看起来并不那么好。在 20K(20,000) 和 30K 迭代之间,未命中率达到峰值。

我很困惑这是什么意思。我的意思是通常我们会期望随着我们对模型的更多训练,未命中率会降低。

我正在使用 yolo 对象检测网络https://github.com/AlexeyAB/darknet/blob/master/cfg/tiny-yolo-voc.cfg

所以学习选项和https://github.com/AlexeyAB/darknet/blob/master/src一样

在此处输入图像描述

我还尝试了小 10 倍的学习率。但是,没有运气: 在此处输入图像描述

1个回答

这是一种比较常见的现象,称为双重下降