计算科学 - GPU 与 CPU FLOP 计数 - 吾爱随笔录

如果这有点像菜鸟问题，我深表歉意。因此，据我了解，在 GPU 板上，与具有更多可用缓存的 CPU 相比，分配给 ALU 的空间要多得多。这应该意味着典型的 GPU 能够处理更高的 FLOP 计数。我认为这是 GPU 的优势（简而言之）。然而，看看市场上一些最先进的处理器的数字，Nvidia 的 3090 卡以 1499美元的价格输出大约 0.5 TFLOPS（双精度），而英特尔的 Xeon 3175-X 处理器输出 1.5 TFLOPS（我猜也是双精度） )售价为2999 美元。因此 CPU 每美元提供更高的双精度 FLOP 计数。

我觉得这些数字有点令人困惑。如果不是整体（或有效）FLOP 计数，GPU 的优势到底是什么？GPU 是否仅在执行单精度或半精度操作时才有优势？

3090 FLOP 计数的来源：https ://en.wikipedia.org/wiki/GeForce_30_series

Xeon FLOP 计数来源：https ://www.intel.com/content/dam/support/us/en/documents/processors/APP-for-Intel-Xeon-Processors.pdf