关于pytorch虚拟环境及具体bug问题修改

发布于:2025-07-19 ⋅ 阅读:(18) ⋅ 点赞:(0)

         本篇博客包含对于虚拟环境概念的讲解和代码实现过程中相关bug的解决

关于虚拟环境

        我的pytorch虚拟环境在D盘,相应python解释器也在D盘(一起),但是我的pycharm中的项目在C盘,使用的是pytorch的虚拟环境,这是为什么行得通呢?

        后来知道 Python 虚拟环境的核心逻辑是 “解释器与项目路径分离”,只要 PyCharm 能正确找到虚拟环境中的 Python 解释器,无论解释器和项目文件在哪个磁盘分区,都能正常工作。具体原因如下:

1. 虚拟环境的本质:独立的解释器与依赖库

        虚拟环境(如你在 D 盘的 PyTorch 环境)本质上是一个 包含独立 Python 解释器(python.exe)和依赖库文件夹(site-packages)的目录。例如,它的路径可能是:
D:\envs\pytorch-gpu\python.exe

        这个环境的核心作用是:

  • 提供一个独立的 Python 解释器,不依赖系统默认的 Python。
  • 所有安装的库(如 torchtensorboard)都保存在该环境的 site-packages 文件夹中(如 D:\envs\pytorch-gpu\Lib\site-packages)。

        只要 PyCharm 能通过路径找到这个 python.exe,就能调用该环境的解释器和依赖库,与项目文件(C 盘)的位置无关。

2. PyCharm 的工作逻辑:关联解释器而非依赖路径

        PyCharm 管理项目时,关键是 “指定项目使用哪个 Python 解释器”,而非 “解释器必须和项目在同一磁盘”。具体流程是:

1. 你在 PyCharm 中为项目指定了解释器路径(D 盘的 pytorch-gpu 环境)。

2. PyCharm 会记录这个路径,并在运行代码、安装依赖时,强制使用该解释器:

  • 当你在 PyCharm 终端运行 pip install xxx 时,实际调用的是 D:\envs\pytorch-gpu\Scripts\pip.exe,安装的库会存到 D 盘的 site-packages
  • 当你运行项目代码时,PyCharm 会用 D:\envs\pytorch-gpu\python.exe 执行 C 盘的项目文件(.py)。

        这种 “解释器在 D 盘,项目在 C 盘” 的分离,就像 “用 D 盘的播放器播放 C 盘的视频文件” 一样自然,完全不冲突。

3. 跨磁盘工作的底层原理

        文件读取机制:操作系统(Windows)允许程序跨磁盘读取文件,只要路径正确(例如,D 盘的 Python 解释器可以读取 C 盘的 .py 代码文件)。

        环境变量与路径解析:虚拟环境被激活时,PyCharm 会临时调整终端的环境变量,让 pythonpip 等命令指向 D 盘的解释器,确保所有操作都基于该环境。

关于tensorboard的实战bug问题

        原代码如下:

from torch.utils.tensorboard import SummaryWriter
# ctrl + 右键 也可以查看这个类的说明

writer = SummaryWriter('log')# 指定日志保存目录

# writer.add_image()
for i in range(100):
    writer.add_scalar('y=x', i, i) # 添加标量数据

writer.close()

        在终端运行时,大家可以很清楚看到,使用python来运行和直接使用类来运行的差别,前者可以正常运行,后者会报错,找不到路径

(pytorch-gpu) PS C:\Users\admin\Desktop\huahuo\pytorch_learn\pycharm> python -m tensorboard.main --logdir=log
TensorFlow installation not found - running with reduced feature set.
Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
TensorBoard 2.19.0 at http://localhost:6006/ (Press CTRL+C to quit)

(pytorch-gpu) PS C:\Users\admin\Desktop\huahuo\pytorch_learn\pycharm> tensorboard --logdir=log
tensorboard : 无法将“tensorboard”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。
所在位置 行:1 字符: 1
+ tensorboard --logdir=log
+ ~~~~~~~~~~~
    + CategoryInfo          : ObjectNotFound: (tensorboard:String) [], CommandNotFoundException
    + FullyQualifiedErrorId : CommandNotFoundException

        差别原因在于:在命令行中直接运行 tensorboard 命令和通过 Python 模块(python -m tensorboard.main)调用 TensorBoard 时,系统查找可执行文件的方式存在差异

PATH 环境变量方面

  • 当使用 python -m tensorboard.main 命令时,Python 会依据自身的模块搜索路径来查找 TensorBoard,这和环境变量 PATH 没有关系。

  • 而直接输入 tensorboard 命令时,系统会在 PATH 环境变量所列出的目录里查找对应的可执行文件。要是 TensorBoard 的可执行文件所在目录没有被包含在 PATH 中,就会出现找不到命令的错误。

Anaconda 环境的特性

  • Anaconda 环境在激活之后,会动态地对 PATH 进行修改,把环境中的 Scripts 目录添加进去。不过,这种修改有时候可能会失败或者不完整。

  • TensorBoard 的可执行文件一般位于 Anaconda 环境的 Scripts 文件夹中,比如:

C:\Users\admin\anaconda3\envs\pytorch-gpu\Scripts\tensorboard.exe

解决办法

方法 1:使用 Python 模块调用

        推荐继续采用 python -m tensorboard.main --logdir=log 这种方式来启动 TensorBoard,因为它不依赖 PATH 环境变量,所以更加可靠。

待续


网站公告

今日签到

点亮在社区的每一天
去签到