如何解释 CNN 训练期间的正则化损失曲线?

数据挖掘 深度学习 损失函数 物体检测 正则化
2022-03-09 16:34:02

我正在微调 tensorflow 对象检测 api 中的单次检测器 (SSD)。

我没有冻结骨干​​网(mobilenet),我将学习率编程为从 e-3 到 e-4 到 e-5。

在论文中,损失函数是加权 l1 norm 和加权 softmax的总和。但是是 tensorflow object detection api,默认配置使用加权 sigmoid而不是加权 softmax

当我在张量板上可视化训练进度时,我得到一条曲线,显示正则化损失的进度。这是我得到的两个不同的曲线示例(第一张图片:当我使用加权 softmax 时,第二张图片:当我使用加权 sigmoid 时):

使用加权 softmax 时的正则化损失

使用加权 sigmoid 时的正则化损失

如何解释正则化损失的进展,高时是坏的吗?

0个回答
没有发现任何回复~