有没有人能够在 Ubuntu 16.04/15.10/15.04 上使用 GTX 1070 GPU 运行 Tensorflow?

数据挖掘 张量流 显卡
2021-10-12 01:26:01

在过去的 3 天里,我一直在扯头发,但我无法让它发挥作用。

我最近获得了 GTX 1070,并进行了全新安装:

  • Ubuntu 16.04/15.10/15.04
  • PPA 驱动程序 nvidia-367
  • 库达 7.5

尽管遵循了各种说明,但不知何故,我无法让 CUDA 检测到我的 GPU:

https://askubuntu.com/questions/693145/installing-cuda-7-5-toolkit-on-ubuntu-15-10

https://www.pugetsystems.com/labs/hpc/GTX-1080-CUDA-performance-on-Linux-Ubuntu-16-04-preliminary-results-nbody-and-NAMD-803/

有没有人能够让 1070/1080 正确地运行 CUDA 和 tensorflow,并且可以指导我完成这个痛苦的过程?

(我不能做 Ubuntu 14.04,因为它没有注册我的 wifi 卡,所以我什么也做不了)

4个回答

我在同一条船上,但现在我已经弄清楚了,我在这里列出了在 Ubuntu 16.04 LTS 上使用 cuda 工具包 8.0、cudnn 5.1、bazel 0.3 安装 tensorflow 0.9 的步骤:http: //abhay.harpale.net /blog/machine-learning/deep-learning/getting-tensorflow-to-work-with-gpu-nvidia-gtx-1080-on-ubuntu-16-04-lts/

这是要点

  1. 安装 NVidia Cuda 工具包
  2. 安装英伟达 CuDNN
  3. 安装 swig、python-dev、numpy、python-wheel、zlib1g、g++ 等 Tensorflow 依赖项
  4. 使用 Bazel 配置和构建 tensorflow

这帮助我在 16.04 ubuntu 机器(驱动程序 367.27)上运行 GTX 1080:http: //yangcha.github.io/Tensorflow/

它基本上说安装 CUDA 8RC、CuDNN 5 并按照说明从源代码构建 TensorFlow。

我认为 GTX 1070 在这方面的行为应该与 GTX 1080 相同。

这花了我很长一段时间才刚刚好,但这就是我所做的 下载 Ubuntu 16.04 .iso 下载 unetbootin 从驱动器引导以安装 ubuntu 使用 3rd parter 驱动程序以避免无线问题 下载 NVIDIA 1070 卡的驱动程序 367.27 点击 ctrl-alt -f1 打开虚拟终端 sudo service lightdm stop cd ~/Downloads sudo chmod 755 "name of driver".run sudo ./"name of driver".run cd reboot

Download CUDA 8.0 and patch 1
Hit ctrl-alt-f1 to open a virtual terminal
sudo service lightdm stop
cd ~/Downloads
sudo chmod 755 "name of CUDA installer".run
sudo ./"name of CUDA installer".run --override
*Do not install the driver since we already did
sudo chmod 755 "name of CUDA installer".run
sudo ./"name of CUDA installer".run --override
sudo chmod 755 "name of CUDA patch".run
sudo ./"name of CUDA patch".run
cd
reboot

Download cuDNN 5.1
cd ~/Downoads

tar xvzf cudnn-8.0-linux-x64-v5.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64
sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.h /usr/local/cuda-8.0/lib64/libcudnn*

Run and add the following to bash file

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda-8.0


sudo apt-get install python-pip python-dev

sudo apt-get install git


$ git clone https://github.com/tensorflow/tensorflow

sudo apt-get install openjdk-8-jdk


sudo apt-get install pkg-config zip g++ zlib1g-dev unzip

Download bazel-0.3.1 for linux


 chmod +x bazel-version-installer-os.sh
 ./bazel-version-installer-os.sh --user

sudo apt-get install python-numpy swig python-dev python-wheel

cd ~/tensorflow

./configure

use CUDA 8.0 and cudnn 5.1.5

bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer


bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu

bazel build -c opt --config=cuda //tensorflow/tools/pip_package:build_pip_package

bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg

sudo pip install /tmp/tensorflow_pkg/tensorflow-0.10.0rc0-py2-none-any.whl


cd tensorflow/models/image/mnist
python convolutional.py

我创建了一些 GIST 文件,其中包含如何“在 Ubuntu 16.04 上安装 TensorFlow v 0.11 和 CUDA 8.1 | CUDNN 5.1”的步骤

https://gist.github.com/denti/41860cb6b55e0847b4f2685016c7f14e

它对我来说非常适合新鲜的 16.04。您可以从头开始使用 install bazel 和 tensorflow 跳过最后一部分。