大模型系列课程学习-基于2080TI-22G魔改卡搭建双卡大模型训练平台(双系统)

发布于:2024-07-01 ⋅ 阅读:(18) ⋅ 点赞:(0)

1.选择合适的硬件配置

再配置电脑之前,需要确认自己需要的显存大小、主板、内存条、电源、散热等核心配件。经过前期调研,选择的硬件配置如下:
(1)主板:华南X99_F8D(DDR4主板),因为需要支持双卡,综合价格等多种因素,选择了该主板,
在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ebd4a0df02c4571b0fbc33e50d19274.png
(2)CPU:E5-2680V42(线程28个)价格便宜,且线程多
在这里插入图片描述
(3)内存条:16G
4 (DDR4),这里面选三星或者国产内存条均可
(4)显卡: 2080ti-22G魔改卡 *2【显卡之间nvlink连接】,一般情况,单卡全卡功耗在250W左右
在这里插入图片描述
(5)散热:散热器 4铜管 或 6铜管
(6)电源:选择了1250W的模块化电源【CPU:240W+GPU:500W+主板、散热器、风扇等,留有余量,选择大点的】
(7)电脑机箱:这里一定要根据主板和显卡大小选择,我选择的是宙斯盾的,稍微贵了一些,之前选的坦克机箱和航佳机箱都没货了。
(8)存储:NVME固态+SATA固态(分别安装windows和ubuntu系统)

2.硬件组装- X99主板安装基础硬件设施

x99主板的硬件外围图如下:
在这里插入图片描述
实物图如下:
在这里插入图片描述

2.1 CPU安装:

CPU的安装、散热器的安装可以移步至x99主板安装视频
在这里插入图片描述

2.2 显卡安装

显卡安装需要注意,建议一张一张卡的安装,先把系统点亮后再安装另一个显卡,因为显卡厚度原因,建议PCIE显卡安装为主如下图所示
在这里插入图片描述
在这里插入图片描述
显卡安装实物图如下(建议先安装一个卡,系统正常运行后再逐步添加卡):
在这里插入图片描述

2.3 电源安装(这里使用的是全模组电源,主要是方便)

在这里插入图片描述
接线示意图如下
在这里插入图片描述

3.电脑系统安装(Windows11 + ubuntu系统)

3.1windows电脑系统安装

windows系统安装比较简单,大概的步骤就是弄一个U盘,然后使用大白菜弄个启动盘,然后安装系统即可,可以参考windows系统U盘安装教程,一般购买硬盘,店家都会给你预装,想省事的话可以让店家把你预装一个,然后再自己去官网下载个系统盘,直接执行安装即可windows11安装系统
因为windows系统大家都比较熟悉,安装的时候记得自己安装在哪个硬盘即可
在这里插入图片描述
需要注意,window显卡驱动需要单独从官网下载安装,此外,因为本次使用的显卡为涡轮卡,需要设置显卡风扇速度,避免显卡过热(可以通过bios或者NVIDIA Inspector 进行设置)链接

3.2 Ubuntu系统安装

ubuntu系统安装同winodows比较类似,唯一不同的是这里的显卡驱动在安装系统时可以选择自动安装,我这里面参考的教程如下ubuntu系统安装
过程中遇到不少问题:
a.ERROR:BIOS/LEGACY BOOT OF UEFI-ONLY MEDIA
在这里插入图片描述

原因:启动盘的引导项是用于uefi模式启动,但是服务器的引导启动方式为legacy ,所以导致报错。
解决方案:重新弄启动U盘,或者查找系统安装位置是否正确,可以参考链接
b.界面无显示,系统之前已经成功,但是无显示(可能是显卡驱动安装不对)
c.主板液晶屏显示报错,相关报错码如下:
在这里插入图片描述
在这里插入图片描述
系统安装完毕后,再次安装另一个显卡和nvlink

3.3 显卡及NVLINK的设置(以ubuntu系统为例)

(1)在上述安装完双系统后,需要对显卡和nvlink的配置进行设置,确保显卡散热正常
(2)一般windows系统中NVIDIA Inspector设置风扇速度这块为灰色,无法设置,建议使用ubuntu进行设置,一般情况下代码在linux的环境下,使用更为方便
(3)显卡风扇配置
a. sudo nvidia-settings
在这里插入图片描述
b.安装完毕后打开软件,设置风扇速度为最大
在这里插入图片描述

(4)打开命令行界面,首先查看显卡是否正常:nvidia-smi
在这里插入图片描述
(5)查看nvlink连接是否正常:nvidia-smi topo -m
在这里插入图片描述