ubuntu22.04版本安装显卡驱动-安装深度学习基本环境(conda/cudnn/anaconda/pytorch/pycharm)过程

发布于:2024-08-14 ⋅ 阅读:(110) ⋅ 点赞:(0)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


一、安装显卡驱动

我的显卡是gtx1660super,我首先看了一些博主的教程,发现有点复杂,需要去官网下载相关驱动,然后禁用集显,然后再用一些命令行安装,比较麻烦,然而现在ubuntu的软件安装与更新可以自动安装显卡驱动了。

等安装好后直接重启即可。
在这里插入图片描述

二、安装conda

1.进入CUDA官网复制所需版本的安装命令

访问CUDA官网,选择你需要下载的CUDA版本,我选择的是CUDA11.3.0
官方下载链接:https://developer.nvidia.com/cuda-downloads。

CUDA大版本与显卡驱动里面的CUDA Version的大版本相同即可,小版本不影响

https://developer.nvidia.com/cuda-11.3.0-download-archive
在这里插入图片描述
在这里插入图片描述
然后选好对应的系统配置后下载run版本的,复制官方给出的Installation Instructions:的指令到终端中运行:

wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/
cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run

安装过程中,首先输入accept,取消勾选Driver(已经安装了驱动),选择Install,回车
在这里插入图片描述
我们在第二步已安装显卡驱动Driver,由此Driver不选,只需要把cuda tool勾选即可

2.当执行cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run时会出现gcc报错

这是由于gcc版本不匹配的问题
2.2.2解决方法二

变更gcc版本
2.2.2.1 CUDA11.0

可能你的gcc版本太高,变更gcc版本为9

 sudo apt install gcc-9 g++-9
     
 sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 70 --slave /usr/bin/g++ g++ /usr/bin/g++-11
     
 sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 100 --slave /usr/bin/g++ g++ /usr/bin/g++-9
# 10,20这些表示的是优先级,可根据需要选定,优先级高的即为默认的。

切换gcc版本,这里输入2,选择gcc-9

sudo update-alternatives --config gcc

查看更改结果

gcc --version

3.配置环境变量

在.bashrc内把cuda的目录加入到PATH中,否则的话系统找不到CUDA

sudo gedit  ~/.bashrc

在文件末尾加上(注意更改cuda版本为你安装的版本号,这里是cuda-11.0)
注意:这个三行的路经千万不要用,因为我的电脑装了ros2,再运行ros2时会出现兼容性问题报错

rcl_action.so: cannot open shared object file: No such file or directory

  export CUDA_HOME=/usr/local/cuda-11.0
    export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
    export PATH=${CUDA_HOME}/bin:${PATH}

所以要用下面这个,把11.0改为自己下载的版本号:

export PATH=/usr/local/cuda-11.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH

运行.bashrc文件

$source ~/.bashrc

4.测试是否安装成功

终端输入

nvcc -V

出现下列页面,,显示的cuda版本正是所安装版本,说明CUDA安装成功

四、安装cuDNN

1.下载cuDNN

​​​​​​cuDNN官网cuDNN Archive | NVIDIA Developer

进cudnn官网下载前需要先登录,然后选择与CUDA版本对应的版本下载。
这里我一直进不去官网,ubuntu又不知道怎么挂梯子,所以先在windows系统挂梯子下载好文件然后传到ubuntu上

2.解压文件

首先cd进入下载的文件夹,我的下载到Downloads文件夹下

cd Downloads

使用tar工具解压,tar是tape archive的全称,它预装在Linux系统中。 xz是一个基于LZMA算法的文件压缩算法,使用xz算法压缩的文件通常以.tar.xz或.txz结尾。

解压tar.xz文件,可以使用tar命令带上-x(–extract)选项并用-f指定压缩文件名,

tar -xf后面加的是刚才下载好的cudd的压缩文件名

tar -xf cudnn-Linux-x86_64-8.9.5.30.tar.xz

3.复制文件

将解压出的cuda目录下的inlcude内的头文件以及lib内的链接库全部复制到/usr/local/cuda的对应文件夹下:(注意自己的目录名,有的文件夹名是lib,有的是lib64)

sudo cp cuda/lib64/* /usr/local/cuda-11.0/lib64/
 sudo cp cuda/include/* /usr/local/cuda-11.0/include/

至此,GPU驱动、CUDA、cudnn就都安装好了。

五. 安装anaconda

Anaconda是一种软件包管理,它为编程语言Python和R提供图形导航,支持数据科学、数据分析和机器学习。
Anaconda让您不必担心有时遇到复杂的依赖关系问题。此外,Anaconda有一个名为Conda的包管理器,它可以使分发中的所有包保持最新。它促进了库和开发环境的安装和管理,支持在Python和R下进行数据分析和机器学习。总的来说,有许多软件包可用,包括Jupyter Notebook、Spyder、NumPy和TensorFlow。
Anaconda可用于Microsoft Windows、macOS和Linux的个人、商业、团队和企业版本。个人版是开源软件,作为免费软件免费,因此,例如,私人用户可以学习如何处理数据分析。付费版商业版、团队版和企业版为商业使用和公司使用提供了广泛的功能。

1.下载anaconda安装程序,可以anaconda官网或在清华大学开源软件镜像站下载anaconda。

2.运行安装程序

执行bash命令,bash后面是下载好的anaconda文件名

bash Anaconda3-2023.03-1-linux-x86-64.sh

然后一直按回车,yes同意隐私条款

3.配置环境

在 ~/.bashrc 末尾添加:

export PATH="~/anaconda3/bin":$PATH
 
source ~/anaconda3/bin/activate

后执行:

source ~/.bashrc

完成后,进入Anaconda的默认base编程环境中

接下来就可以和windows下一样,使用conda指令创建环境,安装包 了

最后测试anaconda是否成功:

conda list

如果出现很多包名,就说明可以了。

六、安装pycharm

可以直接在Ubuntu Software中搜索pycharm并安装
在这里插入图片描述

七/创建conda虚拟环境

1.创建虚拟环境my_env

使用annaconda的conda命令创建虚拟环境,我的环境My_torch

   conda create -n <环境名称自定义> python=<python的版本号>
例如:conda create -n My_torch python=3.8   输入后回车

完成后显示done,这样我们就创建好啦:接下来

source activate <你的虚拟环境>

成功后可以看到你的环境从base变成了My_torch

2.打开火狐浏览器里输入pytorch官网用来获取下载指令

【Pytorch官网】https://pytorch.org/

由于我的conda版本是11.3,所以到previous过去版本中选择conda版本,选择版本,下面得到安装指令

CUDA 11.3

conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch

在我的my_env环境中进行安装:

如图,总是报错httperror,说明是网络问题。没办法
原文用官网能装上但我装不上,在验证阶段一直返回false。

解决办法:去清华大学镜像站下载 链接:清华镜像

https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/

然后根据conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
这里面的版本去一个个查询对应的版本的文件再下载

3.无法直接用网络安装pytorch,下载镜像文件到目录,在虚拟环境中离线安装

source activate Deeplearning \激活你创建的虚拟环境

conda install --offline pytorch-2.1.1-py3.11_cuda12.1_cudnn8.9.2_0.tar.bz2

conda install --offline torchaudio-2.1.1-py311_cu121.tar.bz2

conda install --offline torchvision-0.16.1-py311_cu121.tar.bz2

4.测试是否安装成功

最后验证:

source activate Deeplearning \\激活你创建的虚拟环境
python \\运行python (启动命令与你上文中起的别名有关)
import torch \\导入torch模块,这里应该没有任何输出
torch.cuda.is_available() \\输出True则安装成功
exit() \\退出python
conda deactivate Deeplearning \\退出虚拟环境

很不幸,又又又报错了:当我import torch时,报错:
忘记了,反正找了一堆教程都不行,实在没辙,我感觉可能是之前的一个疏忽导致的:

就是我使用conda create创建一个新的虚拟环境时,终端的前缀是(base),也就是说我把新的虚拟环境创建在了base虚拟环境的路径中了,导致无法检索到,所以我干脆使用conda deactivate删除了这个环境,新建了一个zyl_torch环境,这次我特地先cd ~/,没在base里创建,然后使用offline离线安装那三个安装包

但是,依然报错,no moudle name torch,我福了。
没想到峰回路转,我直接用官方命令:
conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
居然这次网络正常了,下载后 import torch 没有报错了。

然饿,当我 torch.cuda.is_available() 时,又又又又报错了,返回了false。

最后发现,conda install pytorch1.12.1 torchvision0.13.1 torchaudio0.12.1 cudatoolkit=11.3 -c pytorch这个指令不好用,我又回退了一个版本,再次创建了一个新的虚拟环境mytest,
conda install pytorch
1.11.0 torchvision0.12.0 torchaudio0.11.0 cudatoolkit=11.3 -c pytorch
这个版本安装之后,就返回ture了。

注意一个重要问题:
①如果不用国内源,就要开梯子代理来下载
②如果添加了国内源:

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

就需要先关闭梯子,不然会一直卡住。

八/ 下载yolov5代码,用pycharm打开

1.下载代码

去这个网站clone代码:https://github.com/ultralytics/yolov5
解压后在pycharm中打开。选择解释器的环境为创建的虚拟环境zyl_torch

然后安装requirements.txt
这里我先直接下载
pip install -r requirements.txt
到一半网络超时了,所以用清华园下载
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

2.下载权重

ubuntu的网很差,下载不了,我用QQ远程传文件下载的yolov5s.pt

3.运行detect.py代码发现可以正常运行。