计算科学 - 标量拉普拉斯系统的预条件子 - 吾爱随笔录

标量拉普拉斯系统的预条件子

计算科学参考请求预处理

2021-12-07 17:06:13

假设我有一个大型（大约 10^6 个未知数）3D 标量 Poisson 系统，我想对其进行预处理。边界条件已经过处理，因此系统是 SPD。IE，

\nabla \cdot (κ (x) \nabla u (x)) = f

$\nabla\cdot(\kappa(x)\nabla u(x)) = f$

矩阵往往具有以下结构（这是一个非常小的问题，较大的问题确实是稀疏的）：

是否就如何对此类系统进行预处理（理想情况下以可以并行实施的方式）达成共识？

线性系统是 SPD，因此选择 PCG 方案似乎很自然，但我一直未能就如何选择预条件子达成共识，因为许多论文处理的是更复杂的 Stokes-like 系统。

2个回答

预处理和迭代求解器很酷，但是您是否尝试使用某种稀疏直接求解器来解决您的问题？如果没有，请先尝试。

针对这类问题的最先进的预处理技术是多重网格技术。在许多情况下，多重网格允许您在时间内解决您的（椭圆）问题。 $O(n)$

如果您不想更深入，一个好的开始可能是代数多重网格。您可以将其作为独立求解器和 CG 预处理器进行尝试。例如，它在PETSc中实现。
如果您确实想更深入，那么本文就是一个好的开始。它有一个很好的示例集合，揭示了多重网格的行为，具体取决于问题的几何形状、参数和等等。 $f$ $\kappa$

使用 SPD 矩阵，调用它 $A$ ，PCG是一个好方法。

预处理器的种类很大程度上取决于您所拥有的矩阵结构（读取矩阵的种类），并且没有唯一的答案。

选择预处理器的基本标准， $P$ , 不止一个。考虑到 PCG，最重要的三个是：

$AP^{-1} \approx I$
$P$ 造价便宜
计算出来的 $P^{-1}r_{k+1}$ 便宜

一般来说，对于像拉普拉斯这样的问题，您可以尝试以下两个。

对角线 $D^{-1}$ 对角线预处理器很容易实现且应用成本低，但效率不高。矩阵包含的诗句 $A$ 对角线项。如果与矩阵一起使用会更好 $A$ 对角占优，但是当额外的对角项很大时，您会发现问题。

不完整的乔列斯基 $\tilde{L}\tilde{L^T}$ 怀特 $A$ SPD 定义为Cholesky 分解。这个预处理器的想法是使用分解但保留稀疏模式 $A$ ，即您仅将分解计算的术语用于 $A$ 不同于零。这种不完全分解的存在取决于结构 $A$ ，例如，如果 $A$ 是一个 $M$ 矩阵没问题。如果您重新排序节点，这种预处理器可以改进 $A$ 所以小胡子 $A$ 更短（在这里你可以看到一个例子，它的结构 $A$ 很重要）。此预处理适用于 forward 和 back 方法（至于 $LU$ 分解）

当您在这里谈论并行执行时，了解硬件类型很重要。无论如何，您必须并行化预处理器应用程序，例如 $D^{-1}$ 你并行化 $\frac{v_i}{d_i}$ 整个向量的操作。

既然你提到了斯托克斯的问题，我添加了一些关于并行的行。如果您的目标是使用重度并行化，因为 gpu 很重要，那么使用预处理器和 gpu 的简单应用程序很重要，如乘积矩阵向量稀疏 (SpMV)。在 Li 和 Saad [1] 的文章中，对 gpu 的各种预处理器进行了比较。

在 gpu多项式预处理器的情况下是好的。我个人使用这种对其他传统 gpu 预处理器具有良好性能的方法，请参阅指向 CUSP 组的此链接，其中我提供了一些详细信息、参考，以及带有一些结果测试的代码。这是一个最小二乘预条件子，它使用 Chebyshev 多项式，因此不涉及显式求积公式，详细信息请参见 J. Erhel、F. Guyomarc 和 Y. Saad [2] 的文章。

[1] 李瑞鹏和优素福萨阿德。Gpu 加速的预处理迭代线性求解器。超级计算杂志，63（2）：443–466，2013。

[2] J. Erhel、F. Guyomarc 和 Y. Saad，用于病态线性系统的最小二乘多项式滤波器，Tech。报告 umsi-2001-32，明尼苏达大学明尼苏达超级计算机研究所，明尼苏达州明尼阿波利斯，2001 年。

其它你可能感兴趣的问题

上一篇CFD 求解器中的自动时间步长调整下一篇将最佳多边形拟合到离散轮廓