计算科学 - 要求解的集合线性方程的最大大小？(X=AX+B) - 吾爱随笔录 - 问答

要求解的集合线性方程的最大大小？(X=AX+B)

计算科学线性代数矩阵

2021-12-19 00:22:50

Stack Overflow上也有人问过这个问题。

这是一个非常普遍的问题，关于一组线性方程组的最大大小，由当今最快的硬件求解，形式为：

X = A X + B

$X = AX + B$

我们在哪里解决 $X$ ，和

$A$ ： $N\times N$ 一个稀疏的浮点矩阵；
$B$ ： $N$ - 浮点数向量。

这变成 $X(I-A) = B$ 正如我在这里读到的，最好使用分解（而不是矩阵求逆）来解决。

您是否知道或参考了基准或论文，该基准或论文给出了一些最大值 $N$ 拥有当今最快的硬件？假设我可以拥有那个硬件，这是一种心理假设练习。我见过的大多数基准测试都使用 $N < 10000$ . 我在考虑 $N>10^7$ 或更多要在一个月内处理。

请不仅考虑计算维度，还要考虑存储 $A$ . 这可能是一个问题，例如，假设 $N = 10^6$ ，存储将是 $4\times 10^{12}$ 字节 $\approx$ 4 TB 用于一个完全密集的矩阵，我猜这是可以管理的。

最后，解决系统的方法是否可以并行化，以便我可以假设并行化 $N$ 能变大吗？

后来除了问题：

一个可能的应用是：考虑来自工厂的 N 种产品（例如螺钉、电动机、发动机、汽车）。大多数产品需要来自其他产品的零件，并用作其他更复杂产品的零件，除了一些在商店结束的数量 - 例如电动机。

为了 $i^{th}$ 我们拥有的产品： $X_i = a_{i,1} X_1 + a_{i,2} X_2 + \cdots + a_{i,N} X_N + B_i$ 意味着数量 $X_i$ 我们的目标是生产需要 $a_{i,1} X_1$ 产品中的物品 $X_1$ ，到 $N$ , 加上 $B_i$ 这是最终在商店中用于一般消费的东西。

我们的目标是在给定最终需求的情况下找到该问题的解决方案（ $B$ ) 和“相互依赖”的数量 $A$ .

我猜 $A$ 是稀疏的，但这可能取决于应用程序，例如，丰田声称一辆基本汽车由 30,000 种其他产品组成（全部分解为螺丝）。这就是为什么我提到稀疏但我也选择“温和密集”的最坏情况。

1个回答

对于您的应用程序，密集矩阵技术（例如不同的分解技术）将不起作用。另外，您的矩阵无论如何都是稀疏的，因此您应该使用迭代求解器（例如 Krylov 子空间方法）。这些可以轻松处理您感兴趣的规模问题，并且有几个为并行架构（例如 Petsc、Trilinos等）实现的稀疏矩阵求解器库。

使用稀疏矩阵技术有几个优点：

贮存。谁想存储密集矩阵？您是否有数 TB 的 RAM 等待使用？大多数人不这样做，而且您不应该不得不使用磁盘空间，因为这会削弱任何类型的算法性能。您已经说过您的矩阵 A 是稀疏的，这通常意味着总存储空间应该只有 $O(N)$ . 所以它应该只需要兆字节来存储您的矩阵和所需的向量，而不是 TB。
时间。密集矩阵分解采用 $O(N^3)$ 运算，即使是稀疏矩阵。在串行处理器上，方程组与 $N>10^7$ 可以很容易地以年为单位来计算分解。即使并行化，您仍然必须处理存储和通信成本。稀疏方法依赖于矩阵向量乘法，这是一种 $O(N^2)$ 密集矩阵的运算，但 $O(N)$ 稀疏矩阵的运算。通常它需要少于 $O(N)$ 迭代收敛。一般来说，这将花费更少的时间（如果使用良好的预调节器，可能会花费更少的时间）。
并行化。因为迭代方法依赖于矩阵向量乘法和向量向量加法，所以它们是高度可并行化的（尤其是在共享内存架构上，也包括分布式内存）。许多库已经为各种架构提供并行支持（再次参见此处）。

其它你可能感兴趣的问题

上一篇在（二进制）整数程序中破坏对称性下一篇求解非线性边值问题