ubuntu16.04安装Nvidia显卡驱动,CUDA8.0,cuDNN6,TensorFlow-gpu

Welcome To My Blog
实验室学姐让跑一个深度学习模型的程序,需要配置环境,查阅各种资料后安装成功,记录一下安装过程,确实挺刺激,也算是开启了自己的深度学习之旅了.

安装Nvidia显卡驱动

1. 下载驱动

根据自己的系统和显卡型号直接在NVIDIA官网,我是64位ubuntu16.04,显卡是1070Ti,安装的驱动型号是390.67

2. 禁用nouveau第三方驱动

1
2
3
4
在终端输入: sudo gedit /etc/modprobe.d/blacklist.conf  
在最后一行添加:blacklist nouveau
改好后执行:sudo update-initramfs -u
重启后,在终端输入:lsmod | grep nouveau,没有输出则说明禁用成功

3. 命令行模式下安装驱动

1
2
3
4
5
6
7
注销或重启进入登录界面,Ctrl+Alt+F1进入命令行模式  
禁用X服务:sudo /etc/init.d/lightdm stop
cd到下载目录,给下载的驱动.run文件赋予可执行权限:sudo chmod a+x NVIDIA-Linux-x86_64-390.67.run
安装:sudo ./NVIDIA-Linux-x86_64-390.67.run -no-opengl-files(只安装驱动文件,不安装OpenGL文件)
如果安装过程中出现 the distribution-provided pre-install script failed 继续安装即可
开启X服务:sudo /etc/init.d/lightdm start
重启,重新进入图形界面,在终端输入:nvidia-smi,显示显卡信息则安装成功

安装CUDA8.0

下载安装CUDA8.0

官网下载CUDA8.0,install type选择deb(local)
下载完成后进入安装包所在文件夹,依次执行下面三句命令进行安装(安装过程中不用安装NVIDIA Graphics Driversl了,已经安装过了,其余的均安装):

1
2
3
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda

配置环境变量

sudo gedit /etc/profile
在末尾加上两句

1
2
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64$LD_LIBRARY_PATH

验证是否安装成功

安装时默认安装了测试用例,以deviceQuery为例

  • cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
  • sudo make
  • ./deviceQuery
  • 显示GPU信息则安装成功

安装cuDNN6.0

下载cuDNN

官网下载下面红框中的三个文件(需要用NVIDIA账号登录,用QQ登录即可):
1.png

安装cuDNN

进入安装包所在目录依次执行下面三句命令进行安装
sudo dpkg -i libcudnn6-doc_6.0.21-1+cuda8.0_amd64.deb
sudo dpkg -i libcudnn6-dev_6.0.21-1+cuda8.0_amd64.deb
sudo dpkg -i libcudnn6_6.0.21-1+cuda8.0_amd64.deb

验证是否安装成功

安装时默认安装了测试用例,以/usr/src/cudnn_samples_v6为例

1
2
3
4
5
将这个例子复制到HOME中,执行: sudo cp -r /usr/src/cudnn_samples_v6/ $HOME
进入到HOME下: cd $HOME/cudnn_samples_v6/mnistCUDNN
进行编译: make clean && make
执行脚本: ./mnistCUDNN
看到命令行输出 Test passed! 则安装成功

如果出现libcudnn.6: cannot…的问题

1
2
之前安装过cuDNN7,使用时出现问题:ImportError: libcudnn.6: cannot open shared object file: No such file or directory的问题,我的问题是出在cuda的lib64文件夹中没有这个文件
解决方法:在computer中搜索libcudnn,最后在/usr/lib/x86_64-linux-gnu中发现了libcudnn.so.7,将这个文件复制到/usr/local/cuda/lib64/中,并更新软连接:ln -s libcudnn.so.7 libcudnn.so.6

安装gpu版的TensorFlow

我用的是ubuntu16.04自带的python2.7,安装的是TensorFlow-gpu-1.4版本,在终端执行:

1
2
export TF_BINARY_URL=https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.4.0-cp27-none-linux_x86_64.whl
sudo pip install --upgrade $TF_BINARY_URL

0%