我是深度学习的新手。我正在努力在一组小物体上训练 SSD 模型。我正在使用 Adam 梯度下降进行优化和大输入(800x800),但我似乎在每 20 个左右的时期(350 步)后只能得到 0.010 的改进。
我可以做什么或寻找什么来加速这个模型的收敛?
我是深度学习的新手。我正在努力在一组小物体上训练 SSD 模型。我正在使用 Adam 梯度下降进行优化和大输入(800x800),但我似乎在每 20 个左右的时期(350 步)后只能得到 0.010 的改进。
我可以做什么或寻找什么来加速这个模型的收敛?
实施以下提到的技术并检查
添加批量标准化
提高学习率
如果您还没有完成,则标准/规范化输入