【记录】HunyuanVideo 文生视频工作流

发布于:2025-05-12 ⋅ 阅读:(17) ⋅ 点赞:(0)

HunyuanVideo 文生视频工作流指南

概述

本指南详细介绍如何在ComfyUI中使用腾讯混元HunyuanVideo模型进行文本到视频生成的全流程操作,包含环境配置、模型安装和工作流使用说明。
参考:https://comfyui-wiki.com/zh/install/install-comfyui/install-comfyui-on-linux

环境准备

1. ComfyUI安装与更新

  • 新安装:参考ComfyUI安装教程
  • 更新:确保使用最新版本(需包含EmptyHunyuanLatentVideo节点)

注意:必须更新至最新版本才能支持完整功能

模型配置

2.1 主模型

文件名称 大小 存放路径
hunyuan_video_t2v_720p_bf16.safetensors 25.6GB ComfyUI/models/diffusion_models

2.2 文本编码器

文件名称 大小 存放路径
clip_l.safetensors 246MB ComfyUI/models/text_encoders
llava_llama3_fp8_scaled.safetensors 9.09GB ComfyUI/models/text_encoders

2.3 VAE模型

文件名称 大小 存放路径
hunyuan_video_vae_bf16.safetensors 493MB ComfyUI/models/vae

目录结构示例

ComfyUI/
└── models/
    ├── diffusion_models/
    │   └── hunyuan_video_t2v_720p_bf16.safetensors
    ├── text_encoders/
    │   ├── clip_l.safetensors
    │   └── llava_llama3_fp8_scaled.safetensors
    └── vae/
        └── hunyuan_video_vae_bf16.safetensors

工作流配置

3. 工作流下载

比例 540p 720p(推荐)
9:16 544×960 720×1280
16:9 960×544 1280×720
1:1 720×720 960×960

核心节点说明

4.1 模型加载

  • UNETLoader

    • 参数:hunyuan_video_t2v_720p_bf16.safetensors
    • 显存优化:可选fp8权重类型
  • DualCLIPLoader

    • 双编码器配置:
      • CLIP 1: clip_l.safetensors
      • CLIP 2: llava_llama3_fp8_scaled.safetensors

4.2 视频生成

  • EmptyHunyuanLatentVideo

    • 关键参数:Width/HeightFrame Count(建议129帧)
  • CLIPTextEncode

    • 提示词规范:
    [主体描述], [动作描述], [场景描述], [风格描述], [质量要求]
    

    示例:

    anime girl with fluffy tail, dancing gracefully, cherry blossom garden, studio ghibli style, 4k ultra HD
    

优化建议

5.1 显存优化

  1. 使用VAEDecodeTiled替代VAEDecode
  2. 调整参数:
    • Tile Size: 256 → 128
    • Overlap: 64 → 32

5.2 质量提升

  • 采样步数:20-30步
  • Guidance Scale:6.0-8.0
  • 推荐分辨率:720p(1280×720)

常见问题

显存不足

  • 解决方案:降低分辨率/使用fp8权重

生成缓慢

  • 优化方向:减少帧数/降低采样步数

🖼️ 画质问题

  • 检查要点:
    1. 提示词详细度
    2. 采样器选择(euler/dpm++_2m)
    3. 去噪强度(建议1.0)
      在这里插入图片描述在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

网站公告

今日签到

点亮在社区的每一天
去签到