高斯牛顿法与拟牛顿法优化的区别

计算科学 优化 算法 牛顿法
2021-11-24 13:08:21

有谁能够帮我?我听说 Gauss-Newton 方法计算 Hessian 的近似值而不是真正的 Hessian,但是,quasi-Newton 方法也是,不是吗?它们之间有什么区别?

任何帮助,将不胜感激 :)

1个回答

Quasi-Newton 方法为任意平滑目标函数构造近似 Hessianf(x)使用的值f在当前点和以前的点进行评估。在该方法的每次迭代中,准牛顿近似 Hessian 矩阵使用在最近一次迭代中评估的梯度进行更新,x(k). 这些近似的 Hessian 不一定是对实际 Hessian 的非常好的近似f,但它们足够好,您可以使用它们在优化算法中获得良好的搜索方向。准牛顿方法有很多,其中最流行的可能是 BFGS(Broyden-Fletcher-Goldfarb-Shanno。)

Gauss-Newton 方法是一种近似牛顿方法,仅适用于可以表示为平方和的目标函数

f(x)=i=1mfi(x)2

对于这种特殊形式的目标函数,如果你让J(x)(雅可比行列式) 是一阶偏导数的矩阵fi(x)关于xj, 然后让F(x)成为的向量f1(x),f2(x),,fm(x), 然后

f(x)=J(x)TF(x)

2f(x)2J(x)TJ(x).

Gauss-Newton 方法(和 Levenberg-Marquardt 方法)在牛顿方法中使用这种近似 Hessian 和精确梯度。

Gauss-Newton方法中的近似Hessian与拟牛顿近似Hessian(BFGS、DFP等)的类型不同。

请注意,可以将 BFGS 等准牛顿方法应用于非线性最小二乘问题,但不能将高斯牛顿方法应用于最小化一般函数f(x).