GPU 与 CPU FLOP 计数

计算科学 浮点 显卡
2021-12-13 01:46:27

如果这有点像菜鸟问题,我深表歉意。因此,据我了解,在 GPU 板上,与具有更多可用缓存的 CPU 相比,分配给 ALU 的空间要多得多。应该意味着典型的 GPU 能够处理更高的 FLOP 计数。我认为这是 GPU 的优势(简而言之)。然而,看看市场上一些最先进的处理器的数字,Nvidia 的 3090 卡以 1499美元的价格输出大约 0.5 TFLOPS(双精度) ,而英特尔的 Xeon 3175-X 处理器输出 1.5 TFLOPS(我猜也是双精度) )售价为2999 美元。因此 CPU 每美元提供更高的双精度 FLOP 计数。

我觉得这些数字有点令人困惑。如果不是整体(或有效)FLOP 计数,GPU 的优势到底是什么?GPU 是否仅在执行单精度或半精度操作时才有优势?

3090 FLOP 计数的来源:https ://en.wikipedia.org/wiki/GeForce_30_series

Xeon FLOP 计数来源:https ://www.intel.com/content/dam/support/us/en/documents/processors/APP-for-Intel-Xeon-Processors.pdf

1个回答

每个 FLOP 的美元并不是真正的问题,而是每个解决方案的美元。如果可以的话,估计或衡量两者,并购买你能负担得起的最好的,以便及时为你提供最佳解决方案。要么使用你的估计,要么找个地方运行基准测试。你可能会找到一个计算中心,它拥有你想要的所有类型的架构,你可以免费使用,或者比自己购买几个节点更便宜。根据资格要求,您也许可以在我们的网站上免费使用您需要的东西。