LlamaFactory/unsloth Demo

发布于:2025-07-12 ⋅ 阅读:(27) ⋅ 点赞:(0)

内部叫Tuning-Factory

0.环境

conda env list
conda remove --name llm --all
conda create -n llm python=3.10 (切记不能11,具体看readme.md的推荐版本)
conda activate llm
pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple --no-build-isolation成功
llamafactory-cli version
在这里插入图片描述

pip install -e “.[torch,metrics]” --no-build-isolation报错
在这里插入图片描述

(pip install --no-deps -e . -i https://pypi.tuna.tsinghua.edu.cn/simple备份)

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e “.[torch,metrics]” --no-build-isolation

llamafactory-cli version报错ImportError: cannot import name 'logging' from 'huggingface_hub'

from transformers import AutoTokenizer,AutoModelForCausalLM

llamafactory-cli help


pip install huggingface_hub==0.30.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install trl==0.15.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install vllm==0.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install trl==0.15.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

llamafactory-cli version

1. 目录结果及模型pt结构

仓库目录

LLAMA-Factory 的项目目录结构,下面将对个几个比较重要的文件和文件夹做简要介绍,方便大家了解整体的框架:

  • 文件夹
  • assets
    • 用途:通常用于存放项目的静态资源,如图像、样式表、JavaScript 文件等。
    • 说明:这些资源可能用于前端展示或用户界面。
  • data
    • 用途:存放数据集、配置文件或其他与数据相关的文件。(微调的数据集下载后就放在这里)
    • 说明:这些文件可能包括训练数据、测试数据或模型配置信息。
  • docker
    • 用途:包含 Docker 相关的配置文件和脚本,用于容器化部署。
    • 说明:这些文件帮助自动化部署过程,确保在不同环境中的一致性。
  • evaluation
    • 用途:存放评估模型性能的脚本和工具。
    • 说明:这些脚本用于衡量模型的准确性和其他指标。
  • examples
    • 用途:提供示例代码和用例,帮助用户快速上手。(微调和训练的参数配置文件在这里)
    • 说明:这些示例展示了如何使用项目中的功能。
  • scripts
    • 用途:存放各种脚本文件,用于自动化任务或辅助功能。
    • 说明:这些脚本可能包括数据预处理、模型训练等任务。
  • src
    • 用途:存放项目的源代码。
    • 说明:这是项目的核心代码所在的地方。
  • tests
    • 用途:存放测试代码,用于验证项目功能的正确性。
    • 说明:这些测试脚本确保代码的质量和稳定性。
微调/训练后的输出文件
  • model在这里插入图片描述

  • config.json
    模型配置文件,包含模型架构、参数等。

  • generation_config.json
    生成时的配置

  • merges.txt
    分词器(tokenizer)的合并规则文件,用于将子词组合成完整的词汇

  • model.safetensors
    安全的二进制格式,存放模型权重信息。模型较大时可能出现多个切片文件

  • optimizer.pt (存储最大)
    猜测优化器状态

  • scheduler.pt

  • tokenizer_config.json

  • tokenizer.json

  • vocab.jaon
    词表


网站公告

今日签到

点亮在社区的每一天
去签到