什么是最陡下降?是精确线搜索的梯度下降吗?

机器算法验证 机器学习 优化 术语 梯度下降
2022-04-05 16:01:05

我对最陡下降的定义感到困惑。

  • 在一些文献中,例如thisthis,最速下降意味着使用负梯度方向和在该方向上的精确线搜索
  • 但是在这个注释中,似乎我们遵循负梯度,该方法可以称为最速下降。

哪一个是正确的?我们可以在负梯度方向最速下降中调用使用固定 alpha(没有线搜索)吗?

术语“最陡下降”是否定义松散?

2个回答

最速下降是梯度下降的一种特殊情况,其中选择步长以最小化目标函数值。梯度下降是指计算目标函数的梯度,然后沿指示方向“下坡”的任何一类算法;步长可以是固定的、估计的(例如,通过线搜索)或...(有关一些示例,请参见此链接)。

正如 Cliff AB 在对 OP 的评论中指出的那样,基于梯度的优化更普遍,指的是任何使用梯度来优化函数的方法。请注意,这并不意味着您必须沿梯度指示的方向移动(例如,参见牛顿法。)

梯度是导数(在某个点)的多变量泛化。虽然可以在单个变量的函数上定义导数,但对于多个变量的函数。

由于下降是负斜率,并且为了执行梯度下降,我们正在最小化误差,那么最大陡度是最大的负斜率。