如何解释平滑 l1 损失?

机器算法验证 深度学习 优化 正则化
2022-01-22 06:21:49

我希望了解平滑损失的作用,但我无法在网上找到任何好的解释,我知道损失计算绝对误差,但平滑有什么用,任何答案都会有所帮助。l1l1L1

1个回答

Smooth L1-loss 可以解释为 L1-loss 和 L2-loss 的组合。当参数的绝对值很高时,它表现为 L1-loss,当参数的绝对值接近于零时,它的行为类似于 L2-loss。方程是:

L1;smooth={|x|if |x|>α;1|α|x2if |x|α

α在这里是一个超参数,通常取为 1。出现在项附近以使其连续。1αx2

值较大时梯度稳定较小时更新期间的振荡较少)的优点xx

另一种形式的平滑 L1 损失是 Huber 损失。他们实现了同样的目标。取自维基百科,Huber损失是

Lδ(a)={12a2for |a|δ,δ(|a|12δ),otherwise.