CUDA环境正确设置
要确保你的系统环境变量正确设置,以包含CUDA 12.2的路径,可以按照以下步骤操作
步骤1:编辑.bashrc
文件
打开并编辑你的.bashrc
文件,以确保环境变量正确设置。
nano ~/.bashrc
在文件末尾添加以下内容:
export PATH=/usr/local/cuda-12.2/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存并退出编辑器(对于Nano编辑器,按Ctrl+O
然后按Enter
,最后按Ctrl+X
退出)。
步骤2:更新环境变量
加载新的环境变量设置:
source ~/.bashrc
步骤3:验证环境变量
验证PATH
和LD_LIBRARY_PATH
是否正确设置:
echo $PATH
echo $LD_LIBRARY_PATH
你应该看到输出包含/usr/local/cuda-12.2/bin
和/usr/local/cuda-12.2/lib64
。
步骤4:添加到/etc/ld.so.conf
并运行ldconfig
如果你想确保系统全局的共享库路径设置,可以编辑/etc/ld.so.conf
并添加CUDA库路径,然后运行ldconfig
。
打开并编辑
/etc/ld.so.conf
文件:
sudo nano /etc/ld.so.conf
2. 在文件末尾添加以下行:
/usr/local/cuda-12.2/lib64
保存并退出编辑器。
运行
ldconfig
以更新共享库缓存:
sudo ldconfig
要检查系统中CUDA共享库(.so
文件)的路径和版本,可以使用以下几种方法:
方法1:使用ldconfig
ldconfig
命令用于配置动态链接库的运行时链接路径。你可以用它来列出系统中已缓存的共享库,并检查CUDA库是否包含在其中。
sudo ldconfig -p | grep cuda
示例输出:
libcuda.so.1 (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so.1
libcuda.so (libc6,x86-64) => /usr/lib/x86_64-linux-gnu/libcuda.so
方法2:使用find
命令
使用find
命令查找CUDA库文件在系统中的具体位置:
sudo find /usr -name "libcudart.so*" -o -name "libcublas.so*" -o -name "libcufft.so*" -o -name "libcurand.so*" -o -name "libcusolver.so*" -o -name "libcusparse.so*" -o -name "libcudnn.so*" -o -name "libnvrtc.so*" -o -name "libnvToolsExt.so*"
方法3:检查CUDA安装目录
如果你知道CUDA的安装目录,可以直接在该目录下查找.so
文件。例如,假设CUDA安装在/usr/local/cuda
,你可以查看其下的lib64
目录:
ls /usr/local/cuda/lib64 | grep ".so"
方法4:检查环境变量
确保你的环境变量设置正确,指向CUDA库的路径。你可以使用echo
命令来检查:
echo $LD_LIBRARY_PATH
输出应包含/usr/local/cuda-12.2/lib64
。
Python示例:
创建一个名为test_cuda.py
的文件:
import pycuda.driver as cuda
import pycuda.autoinitprint("CUDA Version: ", cuda.get_version())
python test_cuda.py
卸载CUDA
可以按照以下步骤进行。这里提供了两种常见的CUDA安装方法的卸载指南:通过包管理器(如APT)和通过运行时安装(直接下载的.run文件)。
方法1:通过包管理器卸载CUDA
如果你是通过包管理器(如APT)安装的CUDA,可以使用以下命令来卸载:
1.1 卸载CUDA和NVIDIA驱动程序
sudo apt-get --purge remove "cuda-*" "nvidia-*"
1.2 卸载所有相关库和工具
sudo apt-get autoremove
sudo apt-get autoclean
方法2:通过.run文件卸载CUDA
如果你是通过下载的.run文件安装的CUDA,可以按照以下步骤卸载:
2.1 找到安装的CUDA版本
首先找到你安装的CUDA版本的路径,通常位于/usr/local/cuda
或类似位置。
2.2 运行卸载脚本
sudo /usr/local/cuda-<version>/bin/uninstall_cuda_<version>.pl
将<version>
替换为实际安装的CUDA版本号,例如11.7
或12.2
。
删除环境变量设置
如果你在.bashrc
或.zshrc
文件中添加了CUDA的路径,需要将这些设置移除。
3.1 编辑.bashrc
或.zshrc
文件
nano ~/.bashrc
3.2 移除与CUDA相关的行
找到并删除如下行:
export PATH=/usr/local/cuda-<version>/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-<version>/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
3.3 保存并退出编辑器
对于Nano编辑器,按Ctrl+O
然后按Enter
保存,接着按Ctrl+X
退出。
3.4 更新环境变量
source ~/.bashrc