解释 nvidia-smi 的结果

数据挖掘 深度学习 英伟达
2021-09-17 09:52:27
Every 1.0s: nvidia-smi                                                                                                                                                                Tue Feb 20 12:49:34 2018

Tue Feb 20 12:49:34 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 390.25                 Driver Version: 390.25                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Quadro M1000M       Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   59C    P0    N/A /  N/A |   1895MiB /  2002MiB |     64%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1166      G   /usr/lib/xorg/Xorg                           239MiB |
|    0      1864      G   compiz                                        80MiB |
|    0      6755      C   python                                      1408MiB |
|    0     25674      G   ...-token=5769296849603E2A1B668201DBB31D6A   149MiB |
+-----------------------------------------------------------------------------+

我是基于 keras+gpu 的深度学习的新从业者。
这是在watch -n 1 nvidia-smi告诉我什么?
它有什么价值主张,可以用来提高gpu的性能吗?

在背景中,一个小的 Keras 模型正在训练。

2个回答

watch是 linux 命令,与命令无关nvidia-smi,使用该nvidia-smi命令将每 1 秒更新一次,它可以让您查看 gpu 参数如何变化:RAM 使用情况、温度、P0(表示性能,哪个 p0 是最佳性能和当你得到 p1,p2,...时性能下降

关于“它可以用于提高 gpu 的性能吗? ” gpu 的性能由 p0 显示,因此您的 gpu 当前处于最大性能。

请注意,watch命令的最小间隔为 0.1 秒,因此如果您使用watch -n 0.1 nvidia-smi,则每 0.1 秒输出一次更新。

更多信息类型man watchman nvidia-smi终端。

您可以参考这篇博文:Like top,但针对 GPU的仪表板的详细说明。

这是什么手表-n 1 nvidia-smitelling 我?

这与 的结果相同nvidia-smi -l 1,它告诉我们如何使用 GPU。如果有多个 GPU 可用,我们可以将我们的 GPU 放置到尚未被占用的设备上,并且我们可以检查我们的模型是否运行良好以及它需要多少内存。

它有什么价值主张,可以用来提高gpu的性能吗?

这绝对是为了帮助我们提高它的性能。我们可以检查内存使用情况和 GPU-Util 来分配计算。