我正在尝试运行具有绝对损失函数的基本梯度下降算法。我可以让它收敛到一个好的解决方案,因为它需要比我使用平方损失更小的步长和更多的迭代。这是正常的吗?我是否应该期望绝对损失需要更长的时间才能得出一个好的解决方案,或者可能会在解决方案周围振荡,而不是说平方损失?
梯度下降振荡很大。我是否错误地选择了我的步进方向?
机器算法验证
优化
损失函数
2022-04-04 22:43:07
其它你可能感兴趣的问题