对于大型矩阵对角化问题,为什么这对 E5-2670 cpu 比 4 E5-2640 cpus 快?

计算科学 并行计算 正则 mpi 拉帕克
2021-12-20 03:40:18

没什么好说的;

在可供使用的几台计算机中,这些是较大的两台;一个有 2x E5-2670,另一个有 4x E5-4640我们正在研究的问题基本上归结为大型矩阵对角化问题(即我一直在处理 125K 秩矩阵,过去曾研究过更大的矩阵。稀疏和非稀疏,使用PARPACK)。

所有的直觉都会告诉我 Quad CPU 4640 应该快得多,但事实并非如此,我根本不知道为什么。两者都启用了超线程,都具有 250GB 内存。

超过 16 核的 PARPACK 并行化所带来的收益是否开始减少,并且由于所需的 CPU 间通信增加而不值得添加额外的处理器?

如果这有很大的不同,这些代码是用 fortran 编写的。

0个回答
没有发现任何回复~