NETLIB 的参考 BLAS/LAPACK 对于复数来说是 MKL 的两倍

计算科学 宠物 表现 布拉斯 复数 英特尔-mkl
2021-12-23 19:05:34

我正在使用 PETSc求解亥姆霍兹方程。我发现使用 PETSc 配置选项,--download-f-blas-lapack我的程序运行速度是使用 MKL 运行​​它的两倍。这是一个普遍的趋势还是有其他因素在起作用?我正在使用 gcc 和 Open MPI 与 PETSc。

1个回答

这通常是由于尝试使用结合 MPI 的线程化 MKL,导致超额订阅。显式配置 PETSc 以使用非线程 MKL 或添加MKL_NUM_THREADS=1到您的环境中。