计算科学 - NVIDIA 的 Turing 的 FP16 性能是其 FP32 的两倍，而 AMD 在 FP16 和 FP32 的性能相同的原因是什么？ - 吾爱随笔录

计算科学浮点

2021-12-17 14:47:27

NVIDIA 的 Turing 的 FP16 性能是其 FP32 的两倍，而 AMD 在 FP16 和 FP32 的性能相同的原因是什么？

就像 GTX 1650 Super 在 FP16 中有大约 8 teraflops 但在 FP32 中有一半。

RX 580 在 FP16 中具有大约 6.174 teraflops，在 FP32 中具有相同的数字。

1个回答

我记得在 2010 年到 2012 年左右，AMD 总是有更大比例的 GPU 核心单元能够执行 FP32 计算（2 个核心中的 1 个），而消费级 Nvidia 卡的比率较低（1 比 8）。我想这仍然是同样的问题。

其它你可能感兴趣的问题