NVIDIA 的 Turing 的 FP16 性能是其 FP32 的两倍,而 AMD 在 FP16 和 FP32 的性能相同的原因是什么?
就像 GTX 1650 Super 在 FP16 中有大约 8 teraflops 但在 FP32 中有一半。
RX 580 在 FP16 中具有大约 6.174 teraflops,在 FP32 中具有相同的数字。
NVIDIA 的 Turing 的 FP16 性能是其 FP32 的两倍,而 AMD 在 FP16 和 FP32 的性能相同的原因是什么?
就像 GTX 1650 Super 在 FP16 中有大约 8 teraflops 但在 FP32 中有一半。
RX 580 在 FP16 中具有大约 6.174 teraflops,在 FP32 中具有相同的数字。
我记得在 2010 年到 2012 年左右,AMD 总是有更大比例的 GPU 核心单元能够执行 FP32 计算(2 个核心中的 1 个),而消费级 Nvidia 卡的比率较低(1 比 8)。我想这仍然是同样的问题。