了解不精确线搜索的 Wolfe 条件

计算科学 优化
2021-12-03 00:42:14

根据 Nocedal & Wright 的 Book Numerical Optimization (2006),不精确线搜索的 Wolfe 条件是,对于下降方向p,

充分减少:f(x+αp)f(x)+c1αkf(x)Tp
曲率条件:f(x+αp)Tpc2f(x)Tp
为了0<c1<c2<1

我可以看到充分减少条件如何表明新点处的函数值x+αp必须在切线下x. 但我不确定曲率条件在几何上告诉我什么。还有,为什么一定要关系c1<c2被强加?这在几何上实现了什么?

1个回答

曲率条件本质上是这样说的:我们知道f(x)p<0(因为p是下降方向)。所以在方向p,它走下坡路。现在,我们正在寻找一个最小值,即一个点f=0. 这意味着我们不想接受步长x+αp其中方向的梯度p, IE,f(x+αp)p仍然像在 x 处一样为负。相反,我们想停在梯度不那么负甚至正的地方。

因为曲率条件的右手边是负数,所以条件的一个常见变体是要求

|f(x+αp)p|c2|f(x)p|
我通常觉得更容易理解。

了解这一点将使您可以轻松构建无法满足这两个条件的情况,除非c1<c2.