我希望了解平滑损失的作用,但我无法在网上找到任何好的解释,我知道损失计算绝对误差,但平滑有什么用,任何答案都会有所帮助。
如何解释平滑 l1 损失?
机器算法验证
深度学习
优化
正则化
2022-01-22 06:21:49
1个回答
Smooth L1-loss 可以解释为 L1-loss 和 L2-loss 的组合。当参数的绝对值很高时,它表现为 L1-loss,当参数的绝对值接近于零时,它的行为类似于 L2-loss。方程是:
在这里是一个超参数,通常取为 1。出现在项附近以使其连续。
值较大时梯度稳定较小时更新期间的振荡较少)的优点。
另一种形式的平滑 L1 损失是 Huber 损失。他们实现了同样的目标。取自维基百科,Huber损失是
其它你可能感兴趣的问题