GPU 性能比基准测试慢约 50%

数据挖掘 表现 硬件
2021-09-20 07:03:58

运行这个基准测试,我在几乎所有深度学习子问题(单精度和仅训练)上的性能比作者慢 50%:

在此处输入图像描述

我在 GeForce 1080 GTX Ti 上对此进行了测试,并使用 PyTorch 1.0.1 和在 AMD Ryzen 7 1700 八核处理器(16 个线程)上运行的 Cuda 10.0.13(cudnn 版本 7402)。操作系统是arch linux。GPU 温度在完全不稳定使用时保持在 80 度以下。

有人知道导致性能下降的原因吗?具有相同 gfx 的其他人可以运行它并让我知道他们看到了什么不同吗?

1个回答

我的猜测是性能下降是由于 PyTorch 版本的差异。已发布的基准测试使用torch==0.4.1(即使自述文件陈述了不同的内容)。您正在使用 PyTorch 1.0.1。

PyTorch 1.0 的速度有时会低于 0.4。torch.backends.cudnn.benchmark = TruePyTorch 1.0 可以通过从源代码添加和编译来加速。

通常,已发布的基准测试是从“现成”版本进行大量调整的。