我正在使用 Tensorflow 对象检测 API 在 COCO 数据集上从头开始训练 CNN。我需要使用这个特定的配置。COCO 上没有具有该配置的预训练模型,这就是我从头开始训练的原因。
然而,经过 1 周的训练并评估了训练阶段生成的每个检查点,这就是我的学习阶段在 Tensorboard 上的显示方式:
因此,我的问题是:
- 有谁知道大约需要多少次迭代?现在我做了超过 500'000 次迭代。
- 500'000 之后的评价怎么可能是 0.8%?我预计会达到 60-70%。
- 为什么500k迭代后突然下降?我认为 eval 应该收敛到某个极限。(这是SGD应该做的)
- 有什么“技巧”可以加快训练阶段吗?(例如:提高学习率等)。