我应该租用计算资源,还是购买自己的计算机

计算科学 高性能计算
2021-12-13 22:55:07

由于这个问题与计算有关,我决定在这里发帖。希望它会被视为适当的。

我刚刚开始运行大气和海洋模型,我意识到我需要比当前桌面更多的内核、内存和磁盘空间。我的机构有一项高性能计算服务,研究人员可以每月以每个内核的固定价格租用内核。我的研究小组中没有人使用过这项服务,而是在他们增强的机器上运行工作。然而,该部门的其他几个研究小组汇集了资金并利用了计算服务。

现在我需要决定是购买具有 60 GB RAM 的新机器,还是从计算服务中租用内核。在做出这个决定时我应该考虑哪些因素?使用计算服务比购买专用机器有什么优势?

4个回答

最终,这个问题的答案取决于您需要的服务的收费价格。以非常低的价格,这几乎肯定比购买自己的电脑要好,而以更高的价格购买自己的电脑会更好。不过,使用共享资源的理由非常充分,这些因素可能会超过计算机的摊销成本。

优点:

  1. 没有系统管理麻烦。即使您有技能(除非您最近有一份全职工作,否则您可能没有),管理和保护计算机也需要时间。由于管理 1,000 台计算机所花费的时间并不比管理 1 台计算机花费的时间多,因此存在巨大的规模经济。

  2. 忙/闲效率。除非您的研究非常不寻常,否则您的计算机可能不会有 24/7/365 持续的工作负载。您可能会去度假几个星期,并且在那段时间没有任何工作要做,或者您可能正在为会议做准备并且有很多额外的工作。共享资源可以很好地处理这些情况。

  3. 获得专家建议。您的共享资源可能会得到计算中心专家的免费帮助。

缺点:

  1. 您不拥有该资源,因此您将来可能会失去访问权限或必须支付更高的价格。

6.60 美元/核心月比核心小时不到一美分。这是一笔不错的交易,而且如果您自己购买相同的硬件并支付自己的电力和系统管理员账单,这比您能得到的更好。如果您要做的只是购买一个可能不太强大且具有足够 RAM 的工作站节点,那么您可能会做得比这更好,但您也可以在中央服务组织提供的更好的硬件上更快地完成工作。他们大概只在您实际运行时向您收费,因此您应该将单个计算的运行成本与您自己购买的成本进行比较。

你会管理这个盒子,还是你会付钱给别人?如果你付钱给研究生做这件事,那么这会延长他们在研究生院的停留时间吗?这公平吗?谁支付你的电费?你能有效地冷却你的购买,还是你必须升级你办公室的空调?如果机器坏了,谁在机器上工作,当它停机时你能承受得起吗?您可以购买多少个核心月来支付您可能购买的机器的成本?等等。

你会一直使用它,很长一段时间?

一般来说,这样做的经济学原理很简单——如果你需要一种有价值的资源来进行短暂的间歇性爆发,那么租用通常比拥有便宜;如果您希望长时间使用其中的大部分,那么拥有它会更便宜。

一个简单的经验法则实际上是关于所使用的术语 - 核心月对您来说是一个有意义的指标,您希望以稳定的方式使用大量核心数月吗?在这种情况下,拥有资源可能是合理的;但是,如果您以核心小时数来描述您的负载(即使总量相同),那么通过例如租用它与他人共享它会是有效的。

此外,还有一个扩展优势——如果你的工作量购买和租用的成本相似,那么安排一个 1200 个核心小时的工作在你购买的服务器的 12 个核心上运行仍然存在很大差异并在 4 天内得到响应,并且能够在一小时内在租用的 1200 个内核上运行它,前提是您的任务并行化得很好。

租用服务是更好的选择。计算机硬件比汽车失去价值的速度更快(当以计算能力衡量价值时),它的价值呈指数下降。

这意味着随着时间的推移,您购买内核的初始投资实际上将接近于 0。因此,您花在租用硬件上的钱并不比购买硬件差多少。

最后,在您的情况下,您从投资中获得的似乎不是计算能力,而是使用计算能力的结果。

所以你的决定是一个经济决定,这样看:

  • 花费的钱 = M
  • 结果值 = R
  • 计算能力随时间变化的价值 = P。

    1. 租赁的期望值 (EV) 为:

      EV(M) = R

      租用时要考虑的另一件事是,相同的投资 M 会随着时间的推移为您提供更多的计算机能力,因为随着时间的推移,相同的技术会以指数方式变得更便宜。

    2. 在 (b) 购买内核的情况下,您的 EV 是:

      EV(M) = R + P

      假设你得到的结果是有价值的,并且这些结果的价值高于核心的价值(即 R >> P),那么 P 的价值就变得无关紧要了。

      另一个问题是,随着时间的推移,P 趋向于变为 0,因为技术以指数速度变得过时,随着时间的推移其值接近 0,所以如果你将 EV 与时间 t 积分,你会得到: EV 与 T(M) = R

很容易看出,购买自己的内核对您的投资 (M) 的预期增值很少。