阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Ubuntu 14.04 上安装 CUDA 7.5/8.0 超详细教程

135次阅读
没有评论

共计 4594 个字符,预计需要花费 12 分钟才能阅读完成。

本篇文章是基于之前安装 CUDA 7.5 的经验写的,但因为最近更新 TensorFlow 到了 r0.12 版本,官方提示该版本 TensorFlow 和 CUDA 8.0 & cudnnv5.1 配合的最好,所以又卸了 CUDA 7.5,重新装了一遍 CUDA 8.0,安装的过程中发现了之前文档里的些许不足,于是做了稍许修改。

PS:本来想在 7.5 的基础上更新到 8.0,但是失败了。还把系统搞崩了,又重装了一遍 Ubuntu,唉,说多了都是泪啊

CUDA7.5 和 CUDA8.0 的安装过程是一毛一样的。所以如果安装 CUDA8.0 的同学,直接将下文中的所有 7.5 替换为 8.0 即可。

折腾了好多天,前后重装了大概六、七次 Ubuntu,终于上把 CUDA 安装好了,被坑了好多次,也走了不少弯路。

第一次发帖,还请多指教。

【环境】

笔记本:ThinkPad T450 X86_64

显卡:主显 Intel HD Graphics 5500;独显 NVIDIA GT 940M

系统环境:Ubuntu14.04 64 位、Windows7 64 位 双系统

CUDA 版本:7.5

其他:Ubuntu 中不存在已经安装的 CUDA

先说说自己遇到的大坑吧,安装完 CUDA 之后总是遇到登录界面循环问题:输入密码后又跳回密码输入界面。尝试了网上的多种说法无解,最终发现我的问题是出在双显卡这里。最后是在官方安装文档中找到了答案。

问题解决方案:

在安装 cuda 时,会出现提示,询问你是否需要安装 openGL Libraries。如果你的电脑是双显,而且用来显示的那块 GPU 不是 NVIDIA,则 OpenGL Libraries 就不应该安装,否则不是 NVIDIA 的那块 GPU 使用的 OpenGL Libraries 会被覆盖,然后 GUI 就无法工作了。

先谈谈关于安装 CUDA 的几点感受吧

关于 CUDA 的安装,网上有特别多的安装帖子,我在安装的时候也参考了很多。你会发现网上很多的安装帖子,一般只做十几个操作就完事了。但是 CUDA 的官方安装文档却非常冗长,有四十多页,别觉得它是废话,其实都是干货。

网上的安装帖子之所以精炼,是因为它只涵盖了必须的安装步骤,跳过了许多的检查操作(例如:检查电脑中是否已安装 CUDA 需要依赖的软件、是否已经卸载会与 CUDA 产生冲突的软件)等。如果你足够幸运,电脑里上恰好该有的有,不该有的没有,那这么做没问题,但通常情况下你并没有那么走运。

CUDA 这个东西需要依赖的、牵着的东西特别多,如果没有做好检查,则在安装时候特别容易出现各种各样的冲突,且一旦冲突发生,即使卸载 CUDA 也不能解决问题,只能重装系统。

我最后就是参考 CUDA 的官方文档安装成功的。

总结一下,我的安装建议是:

1) 一定要下一份 CUDA 官方的安装文档,按照它的步骤一步步慢慢来,不可偷懒。CUDA 7.5 官方安装文档下载 

2) 在安装之前一定要详细检查自己的系统环境、软件是否符合 CUDA 的安装要求。不要存有侥幸心理,跳过检查步骤。

3) 每进行一项操作,都检查一下该项操作是否成功。

下面分享一下我的安装步骤。基本跟 CUDA 的官方安装文档的操作是一致的,不同的地方都有特别注明。

安装 CUDA 主要分三大环节。

一、安装前的环境准备和检查

二、安装 CUDA

三、安装完的校验。

1、安装 Ubuntu 系统 14.04

新安装完的 14.04 系统会提示很多更新项。

网上有很多帖子说不建议更新,说更新过后会导致安装 CUDA 发生系统界面循环登录的问题。

但是我更新后,并没有遇到任何问题。

2、检查自己的电脑环境是否具备安装 CUDA 的条件

a) 检查自己的 GPU 是否是 CUDA-capable

在终端中输入:$ lspci | grep -i nvidia,会显示自己的 NVIDIA GPU 版本信息

去 CUDA 的官网查看自己的 GPU 版本是否在 CUDA 的支持列表中

b) 检查自己的 Linux 版本是否支持 CUDA(Ubuntu 14.04 没问题)

c) 检查自己的系统中是否装了 gcc

在终端中输入:$gcc –version 可以查看自己的 gcc 版本信息

d) 检查是否安装了 kernel header 和 package development

在终端中输入:$uname –r 可以查看自己的 kernel 版本信息

在终端中输入:$ sudo apt-get install Linux-headers-$(uname -r)

可以安装对应 kernel 版本的 kernel header 和 package development

以上检查我的电脑系统都满足要求,如果没有满足要求的话,可以参考 cuda 的官方文档,里面有详细的针对每个问题的解决方案。

3、选择安装方式

CUDA 提供两种安装方式:package manager 安装和 runfile 安装

我本来选的是 package manager 安装,这种方法相对简单,但尝试了几次都失败。后来是转换到 runfile 安装才成功的。因此此处只介绍 runfile 安装方式。

下载 cuda 安装包:cuda 官网下载,根据系统信息选择对应的版本,runfile 安装的话最后一项要选择 runfile 文件 CUDA 7.5 下载链接

4、runfile 安装 cuda

a) 禁用 nouveau

终端中运行:$ lsmod | grep nouveau,如果有输出则代表 nouveau 正在加载。

Ubuntu 的 nouveau 禁用方法:
在 /etc/modprobe.d 中创建文件 blacklist-nouveau.conf,在文件中输入一下内容

blacklist nouveau
options nouveau modeset=0

打开终端,运行

$ sudo update-initramfs –u

设置完毕可以再次运行 $ lsmod | grep nouveau 检查是否禁用成功,如果运行后没有任何输出,则代表禁用成功。

b) 重启电脑,到达登录界面时,alt+ctrl+f1,进入 text mode,登录账户

c) 输入 $ sudo service lightdm stop 关闭图形化界面

d) 切换到 cuda 安装文件的路径,运行 $ sudo sh cuda_7.5.18_linux.run

按照提示一步步操作

遇到提示是否安装 openGL,选择 no(如果你的电脑跟我一样是双显,且主显是非 NVIDIA 的 GPU 需要选择 no,否则可以 yes)
其他都选择 yes 或者默认
安装成功后,会显示 installed,否则会显示 failed。

e) 输入 $ sudo service lightdm start 重新启动图形化界面。

Alt + ctrl +F7,返回到图形化登录界面,输入密码登录。
如果能够成功登录,则表示不会遇到循环登录的问题,基本说明 CUDA 的安装成功了。

f) 重启电脑。检查 Device Node Verification。

检查路径 /dev 下 有无存在名为 nvidia*(以 nvidia 开头)的多个文件 (device files)
如果没有的话,可以参考官方文档里的指导步骤,进行添加。

g) 设置环境变量。

终端中输入 $ sudo gedit /etc/profile
在打开的文件末尾,添加以下两行。

$ export PATH=/usr/local/cuda-7.5/bin:$PATH
$ export LD_LIBRARY_PATH=/usr/local/cuda7.5/lib64

保存文件。

这里有点与官方安装文档稍有不同,需要说明:

官方文档里说只需在终端中运行上述两条 export 语句即可,但如果不将它们不写入 /etc/profile 文件的话,这样的环境变量在你退出终端后就消失了,不起作用了,所以写入才是永久的做法。

h) 重启电脑,检查上述的环境变量是否设置成功。

终端中输入 : $ env
在输出的环境变量中检查有无上述 g) 中设置的变量,如果有则代表设置成功。

到此为止,CUDA 的安装算是告一段落了。为了保险起见,建议进行下述的检查工作,确保真正的安装成功。

 5、安装完毕后的检查工作。

a) 检查 NVIDIA Driver 是否安装成功

终端输入:$ cat /proc/driver/nvidia/version 会输出 NVIDIA Driver 的版本号

b) 检查 CUDA Toolkit 是否安装成功

终端输入:$ nvcc –V 会输出 CUDA 的版本信息

c) 尝试编译 cuda 提供的例子

切换到例子存放的路径,默认路径是 ~/NVIDIA_CUDA-7.5_Samples
(即 /home/xxx/ NVIDIA_CUDA-7.5_Samples,xxx 是你自己的用户名)

然后终端输入:$ make

如果出现错误的话,则会立即报错停止,否则会开始进入编译阶段。
我的第一次运行时出现了报错,提示的错误信息是系统中没有 gcc
然后在终端运行 $ sudo apt-get install gcc 安装完 gcc 后 再 make 就正常了
整个编译的时间持续比较长,耐心等待,大概十几分钟是需要的。

d) 运行编译生成的二进制文件。

编译后的二进制文件 默认存放在~/NVIDIA_CUDA-7.5_Samples/bin 中。
切换路径:cd ~/NVIDIA_CUDA-7.5_Samples/bin/x86_64/linux/release
终端输入:$ ./deviceQuery

看到类似如下图片中的显示,则代表 CUDA 安装且配置成功(congratulation!!)

Ubuntu 14.04 上安装 CUDA 7.5/8.0 超详细教程

再检查一下系统和 CUDA-Capable device 的连接情况
终端输入:$ ./sandwidthTest
看到类似如下图片中的显示,则代表成功

Ubuntu 14.04 上安装 CUDA 7.5/8.0 超详细教程

最后祝大家都能顺利安装 CUDA~~

Ubuntu 15.04 下 Caffe + + CUDA 7.0 安装配置指南  http://www.linuxidc.com/Linux/2016-11/137497.htm

Caffe 深度学习入门教程  http://www.linuxidc.com/Linux/2016-11/136774.htm

Ubuntu 16.04 下 Matlab2014a+Anaconda2+OpenCV3.1+Caffe 安装 http://www.linuxidc.com/Linux/2016-07/132860.htm

Ubuntu 16.04 系统下 CUDA7.5 配置 Caffe 教程 http://www.linuxidc.com/Linux/2016-07/132859.htm

Caffe 在 Ubuntu 14.04 64bit 下的安装 http://www.linuxidc.com/Linux/2015-07/120449.htm

深度学习框架 Caffe 在 Ubuntu 下编译安装  http://www.linuxidc.com/Linux/2016-07/133225.htm

Caffe + Ubuntu 14.04 64bit + CUDA 6.5 配置说明  http://www.linuxidc.com/Linux/2015-04/116444.htm

Ubuntu 14.04 + Cuda7.5 + Caffe 安装配置全过程 http://www.linuxidc.com/Linux/2017-03/141513.htm

Caffe 配置简明教程 (Ubuntu 14.04 / CUDA 7.5 / cuDNN 5.1 / OpenCV 3.1)  http://www.linuxidc.com/Linux/2016-09/135016.htm

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-08/146391.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计4594字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中