安装驱动
卸载驱动(如果有安装的话)
# 有安装驱动,会自带这个命令
nvidia-uninstall
进入 https://www.nvidia.cn/drivers/lookup/
我选择12.4的cuda版本支持,即最高这个驱动支持的cuda到12.4,服务器上是T4的卡
点击下载,获取下载链接,服务器上用wget下载
# 安装驱动
sh NVIDIA-Linux-x86_64-50.127.05.run
# 一定要重启
reboot
安装CUDA
卸载CUDA(如果有安装的话)
cd /usr/local/cuda-10.1/bin/
./cuda-uninstaller
rm -r /usr/local/cuda-10.1/
全选删除,[x]代表选中
进入 https://developer.nvidia.com/cuda-toolkit-archive
选择自己想要的cuda版本下载
下载runfile格式的安装包
# 之前已经安装了驱动了,此时不用勾选CUDA Driver
sh NVIDIA-Linux-x86_64-550.54.14.run
# 验证安装成功
nvcc -V
添加环境变量
vim /root/.bashrc
export PATH=$PATH:/usr/local/cuda-12.1/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.1/lib64
更新torch
cuda版本升级了,torch也可以随之升级
进入 https://pytorch.org/get-started/locally/,按照官方文档pip安装
评论区