如果这有点像菜鸟问题,我深表歉意。因此,据我了解,在 GPU 板上,与具有更多可用缓存的 CPU 相比,分配给 ALU 的空间要多得多。这应该意味着典型的 GPU 能够处理更高的 FLOP 计数。我认为这是 GPU 的优势(简而言之)。然而,看看市场上一些最先进的处理器的数字,Nvidia 的 3090 卡以 1499美元的价格输出大约 0.5 TFLOPS(双精度) ,而英特尔的 Xeon 3175-X 处理器输出 1.5 TFLOPS(我猜也是双精度) )售价为2999 美元。因此 CPU 每美元提供更高的双精度 FLOP 计数。
我觉得这些数字有点令人困惑。如果不是整体(或有效)FLOP 计数,GPU 的优势到底是什么?GPU 是否仅在执行单精度或半精度操作时才有优势?
3090 FLOP 计数的来源:https ://en.wikipedia.org/wiki/GeForce_30_series
Xeon FLOP 计数来源:https ://www.intel.com/content/dam/support/us/en/documents/processors/APP-for-Intel-Xeon-Processors.pdf