为什么优化算法在关键点较慢?
数据挖掘
梯度下降
损失函数
学习率
2022-02-15 06:18:30
1个回答
在该模拟中,移动速度代表步长。步长是学习率 (v)和函数在该点的近似梯度 ( ) 的函数。学习率可以是恒定的。然而,近似梯度不是恒定的。近似梯度通常更接近临界点(即,谷开始逐渐变平)。因此,计算出的更新值变小,移动速度变慢。
其它你可能感兴趣的问题
