计算科学 - Fortran 中元素向量乘法的最快实现是什么？ - 吾爱随笔录

Fortran 中元素向量乘法的最快实现是什么？

计算科学线性代数拉帕克

2021-12-26 16:24:34

我的 fortran 代码包含如下行

integer, parameter :: dbp = kind(1.0d0)
integer, parameter :: n = 1 000 000

real(dbp) :: x(n), y(n), z(n)

y(:) = x(:) * z(:)

我想利用（如果可能的话）一些优化的数学库来执行这个操作。我找到了一个 lapack 例程 dgbmv，它将矩阵乘以向量。如果我创建一个对角矩阵，这将满足我的需要

(\begin{matrix} y_{1} \\ y_{2} \\ ⋮ \\ y_{n} \end{matrix}) = (\begin{array}{ccc} x_{1} \\ x_{2} \\ ⋱ \\ x_{n} \end{array}) (\begin{matrix} z_{1} \\ z_{2} \\ ⋮ \\ z_{n} \end{matrix})

$\left( \begin{array}{c} y_1 \\ y_2 \\ \vdots \\ y_n \end{array} \right) = \left( \begin{array}{ccc} x_1 & & & & \\ & x_2 & & & \\ & & \ddots & & \\ & & & x_n & \\ \end{array} \right)\left( \begin{array}{c} z_1 \\ z_2 \\ \vdots \\ z_n\end{array} \right)$

但我不知道这是否是计算 x(:)*z(:) 的最佳方法。有没有更合适的方法？

3个回答

与从内存加载数据（并将其写回）的成本相比，乘法的成本几乎是微不足道的。如果您担心性能，您应该考虑数据局部性。和值（如果可能的话）执行更多的触发器。 $x_i$ $z_i$

设置对角矩阵充其量没有什么区别，但更有可能灾难性地降低性能。

您正在两个向量之间进行元素明智的操作，因此如果可能的话，最好使用为向量设计的函数。

Lapack库是用于线性代数的，但它是为高度尊重这一基本操作的操作或方法而设计的。

对于代码的优化形式，您可以尝试使用 BlaisB 建议的一些编译器选项。

另一种方法是使用更基本的关卡库，类似Blas（注意 Lapack 是基于 Blas 构建的）。

例如，MKL 有v?mul执行向量-向量元素明智乘法。另请参阅 MKL 论坛中的这个问题。

改写其他人所说的话，您可以将对角矩阵视为向量，这将减少存储它们所需的内存以及计算次数，除非您使用稀疏例程。您可以对其他结构化矩阵（如三对角矩阵）采用类似的方法。

其它你可能感兴趣的问题

上一篇如何使用离散数据估计梯形规则的误差？下一篇您如何为 VTK 生成数据？