我正在微调 tensorflow 对象检测 api 中的单次检测器 (SSD)。
我没有冻结骨干网(mobilenet),我将学习率编程为从 e-3 到 e-4 到 e-5。
在论文中,损失函数是加权 l1 norm 和加权 softmax的总和。但是是 tensorflow object detection api,默认配置使用加权 sigmoid而不是加权 softmax。
当我在张量板上可视化训练进度时,我得到一条曲线,显示正则化损失的进度。这是我得到的两个不同的曲线示例(第一张图片:当我使用加权 softmax 时,第二张图片:当我使用加权 sigmoid 时):
如何解释正则化损失的进展,高时是坏的吗?

