在 HPC 机器上,一个计算节点是否等同于一个主板?

计算科学 并行计算
2021-12-06 00:40:59

我正在使用 MPICH 的 Hydra Process Manager,我计划在多个计算节点上运行作业。目前使用 Intel Xeon E5-2680v2,共有 20 个内核和 2 个插槽(每个插槽 32 GB 内存和 25 MB 三级缓存)。Socket 0 的 hwthreads 标记为 0-9,Socket 1 的 hwthreads 标记为 10-19。

我在 hydra 的文档中看到您可以指定主板选项“B”。在 HPC 的上下文中,这是否等同于计算节点?也就是说,假设我想在其中 2 个计算节点上的 32 个进程上运行作业:

mpiexec.hydra -n 32 -bind-to hwthread -map-by board ./myprogram

它会在我的两个节点之间平等地划分或绑定进程吗?如果没有,你知道我怎么能做到这一点吗?

1个回答

你在这里问了两个不同的问题。MPICH 支持选项或文档可以更好地解决第二个问题。标题问题的答案是“是(通常)”。

我已经看到了多个节点(想想具有独立内存的独立 Linux 操作系统)物理安装在同一个 PCB 板上的设计或提议的设计,但这并不常见。通常,出于制造和工程原因,每个节点都位于单独的 PCB 板或主板上。