梯度下降和线性与非线性定点迭代的收敛

计算科学 线性代数 矩阵 线性求解器 迭代法
2021-12-06 17:27:17

假设一个系统

Ax=b
给出,与ARn×n是一个对称的正定矩阵,并且一些非零bRn. 具有最优步长的梯度法可写为
xk+1=xkαkgk,
gk=Axkbαk=gkTgkgkTAgk.

是否可以证明上述迭代过程收敛于x¯=A1b,不管初始化?

上面的迭代方案可以看成是线性定点迭代吗?实际上,术语线性定点迭代中线性的确切含义是什么?

3个回答

这是一种阻尼理查森方法。由于该操作的一步,不是线性操作,它不是平稳迭代。与只需要一个算子应用并具有更好收敛性的 Krylov 子空间方法相比,每次迭代的额外矩阵乘法和额外缩减的存在使得该方法非常没有吸引力。xkxk+1

这被称为最速下降法,它收敛于任何对称和正定矩阵(线性速率取决于其条件数),与初始化无关;请参阅 Saad 的稀疏线性系统迭代方法的第 5.3.1 章。

它是一种非线性迭代方法,因为新的迭代xk+1不是的线性函数xk(例如,在 Jacobi 或 Gauss-Seidel 迭代中)因为它出现(通过gk) 在定义中αk. 应该指出的是,共轭梯度法(参见 Saad 书中第 200 页的顶部)需要基本相同的工作量,并且(在实践中)具有更好的收敛特性。

很容易验证确实是迭代的不动点。问题是迭代算子 是否是一个收缩。如果是 SPD,如果小于或等于就是这种情况。x=A1b

IαA
Aα1λmax

另一方面,我们只能用简单的参数来推断这不足以保证使用线性迭代的常用参数收敛。换句话说,是迭代的非线性确保了它实际上收敛,如果它确实收敛的话。人们需要更复杂的分析来证明收敛。α1λmin(A)