我正在使用 PETSc求解亥姆霍兹方程。我发现使用 PETSc 配置选项,--download-f-blas-lapack
我的程序运行速度是使用 MKL 运行它的两倍。这是一个普遍的趋势还是有其他因素在起作用?我正在使用 gcc 和 Open MPI 与 PETSc。
NETLIB 的参考 BLAS/LAPACK 对于复数来说是 MKL 的两倍
计算科学
宠物
表现
布拉斯
复数
英特尔-mkl
2021-12-23 19:05:34
1个回答
这通常是由于尝试使用结合 MPI 的线程化 MKL,导致超额订阅。显式配置 PETSc 以使用非线程 MKL 或添加MKL_NUM_THREADS=1
到您的环境中。
其它你可能感兴趣的问题