比较块与非块 Krylov 方法处理多个右手边

计算科学 线性求解器 克雷洛夫法 格瑞斯 块克雷洛夫
2021-12-08 11:54:24

假设我想解决一个线性系统AX=B迭代地在哪里A是一个m×m矩阵和X,Bm×s矩阵(不是单个向量)。而不是解决s独立系统我正在探索同时解决它们的方法,以便矩阵向量产品可以更好地使用缓存(即计算AX应该只需要一次读取A然而Ax1,,Axs需要s读取A.)

一种方法是简单地将其作为大小的线性系统提供ms进入例如 GMRES。

我见过其他所谓的 Block-GMRES 算法,它们使用块 Arnoldi 分解。

块 GMRES 方法的实现似乎有点复杂,并且不清楚增加的复杂性是否值得。

是否知道块 GMRES 在以下方面是否优于非块 GMRES:

  1. 实现解决方案所需的内存
  2. 矩阵-矩阵乘积的数量AX需要计算解决方案
  3. 改进的通信配置文件(也许块 GMRES 需要更少的同步点?或者管道可以更好吗?)
0个回答
没有发现任何回复~