【服务器操作指南 - GPU 使用与文件传输】轻松掌握 GPU 状态查看和服务器文件传输技巧

发布于:2025-03-30 ⋅ 阅读:(30) ⋅ 点赞:(0)

0. 引言

在使用服务器时,高效管理 GPU 和文件传输是两项不可或缺的技能。本指南旨在帮助您快速掌握服务器环境下的 GPU 使用状态监测方法,并简要介绍如何在服务器之间进行文件传输操作。

1. 查看服务器上的 gpu 使用状态

1.1 安装 gpustat

这条指令用于通过 pip 命令安装 Python 的 gpustat 库

pip:Python 的包管理工具,用于安装、升级或卸载 Python 包。

install:指令的操作类型,表示安装一个指定的库或模块。

gpustat:目标库的名称。gpustat 是一个轻量级工具,用于显示 GPU 使用状态,提供有关 GPU 温度、占用率等信息。

执行该指令后,gpustat 库会被安装到您的 Python 环境中,之后您可以通过命令行轻松查看和监控 GPU 的状态。

pip install gpustat

1.2 查看 gpu 使用状态

这条指令用于实时监控 GPU 的使用状态

watch:Linux 下的一个命令,用于定期执行指定的命令并实时刷新显示结果。

-n 1:表示每隔 1 秒运行一次指定的命令,数字可以根据需求调整,例如 -n 5 则表示每 5 秒运行一次。

gpustat:目标命令,用于显示 GPU 的使用状态,包括 GPU 温度、内存使用率、利用率等信息。

整体作用:该命令会每秒更新并显示 gpustat 提供的 GPU 使用状态信息,帮助用户实时了解 GPU 的运行情况,适用于需要持续监控的场景。

watch -n 1 gpustat

1.3 gpu 状态成功展示

依次为索引、显卡型号、显卡温度、显卡占用率、程序占用情况以及用户名。

这段内容列出了 GPU 使用状态信息的几个关键组成部分

索引:表示 GPU 在系统中的编号或序号,用于区分多块显卡。例如,如果系统中有多块显卡,索引可能为 0、1 等。

显卡型号:具体指明显卡的品牌和型号名称,例如 NVIDIA 的 RTX 3090 或 GTX 1080 等。

显卡温度:显示当前显卡的工作温度,通常以摄氏度为单位,帮助监控显卡运行是否在安全范围内。

显卡占用率:即 GPU 的使用率,表示显卡的计算资源被当前任务占用了多少,通常以百分比表示。

程序占用情况:指正在使用 GPU 的程序及其占用的资源情况,例如某个深度学习框架或图像处理软件使用了多少 GPU 内存。

用户名:当前使用 GPU 的用户名称,用于标明是哪位用户在运行任务或占用资源。

在这里插入图片描述

1.4 查看 gpu 的个数和索引等

import torch

# 检查CUDA是否可用
print(torch.cuda.is_available())  # 输出True表示有可用GPU

# 查看GPU数量
print(torch.cuda.device_count())  # 输出可用GPU数量

# 查看当前GPU名称
if torch.cuda.is_available():
    print(torch.cuda.get_device_name(0))  # 例如输出"NVIDIA GeForce RTX 3090"

2. 服务器之间互传文件

两个服务器之间的文件互传可以通过 xftp 轻松实现。

通常情况下,Xftp 被广泛用于本地计算机与服务器之间的文件传输。然而,它同样支持直接在两台服务器间传输文件,无需依赖复杂的指令操作。

只需将右侧的服务器连接页面拖动至左侧的目标位置,然后正常执行文件传输操作,即可轻松实现服务器间文件传输,过程高效且简便。

在这里插入图片描述