我对最陡下降的定义感到困惑。
哪一个是正确的?我们可以在负梯度方向最速下降中调用使用固定 alpha(没有线搜索)吗?
术语“最陡下降”是否定义松散?
最速下降是梯度下降的一种特殊情况,其中选择步长以最小化目标函数值。梯度下降是指计算目标函数的梯度,然后沿指示方向“下坡”的任何一类算法;步长可以是固定的、估计的(例如,通过线搜索)或...(有关一些示例,请参见此链接)。
正如 Cliff AB 在对 OP 的评论中指出的那样,基于梯度的优化更普遍,指的是任何使用梯度来优化函数的方法。请注意,这并不意味着您必须沿梯度指示的方向移动(例如,参见牛顿法。)
梯度是导数(在某个点)的多变量泛化。虽然可以在单个变量的函数上定义导数,但对于多个变量的函数。
由于下降是负斜率,并且为了执行梯度下降,我们正在最小化误差,那么最大陡度是最大的负斜率。