根据 Nocedal & Wright 的 Book Numerical Optimization (2006),不精确线搜索的 Wolfe 条件是,对于下降方向,
充分减少:
曲率条件:
为了
我可以看到充分减少条件如何表明新点处的函数值必须在切线下. 但我不确定曲率条件在几何上告诉我什么。还有,为什么一定要关系被强加?这在几何上实现了什么?
根据 Nocedal & Wright 的 Book Numerical Optimization (2006),不精确线搜索的 Wolfe 条件是,对于下降方向,
充分减少:
曲率条件:
为了
我可以看到充分减少条件如何表明新点处的函数值必须在切线下. 但我不确定曲率条件在几何上告诉我什么。还有,为什么一定要关系被强加?这在几何上实现了什么?
曲率条件本质上是这样说的:我们知道(因为是下降方向)。所以在方向,它走下坡路。现在,我们正在寻找一个最小值,即一个点. 这意味着我们不想接受步长其中方向的梯度, IE,仍然像在 x 处一样为负。相反,我们想停在梯度不那么负甚至正的地方。
因为曲率条件的右手边是负数,所以条件的一个常见变体是要求
了解这一点将使您可以轻松构建无法满足这两个条件的情况,除非.