需要帮助了解集群流程管理器和 MPI

计算科学 并行计算 mpi 高性能计算
2021-11-27 07:32:39

如果这是一个相对简单的问题,我深表歉意。我对设置集群计算机非常陌生,我正在尝试对信息进行正面和反面。

我正在阅读有关在 ubuntu 中使用 MPICH 设置集群的内容。这似乎是一个“简单”的过程。该过程是一个简单的 1,2,3 步骤过程。

然后我遇到了诸如 openMosix 之类的流程管理器。从 MPICH ( https://help.ubuntu.com/community/MpichCluster ) 中概述的步骤来看,我似乎不需要设置进程管理网络,但同时,这些程序有助于管理并行作业。并且 MPICH 具有与流程管理器对话的扩展。

那么,我什么时候会使用流程管理器?这会在大型集群上吗?或者我是否应该始终安装流程管理器并将它们与 MPI 结合使用?MPI(无论是 MPICH 还是 OpenMPI)和流程管理器有什么区别?或者流程管理器是否使用 MPI?

1个回答

您应该使用某种进程或资源管理(又名调度程序)一次,不止一个人会尝试使用集群。除非您有其他方法来保证 A 不会使用 B 的节点,否则您需要一个调度程序。有时,在一些小型实验室中,这是通过两个人并排坐在一起的协议来完成的,但即使这样也注定会失败,因此安装开源调度程序是可行的方法。这不适合胆小的人,但也不是非常难。有很多文件可以帮助你。