一、Stable Diffusion 与 UI 工具概述
Stable Diffusion 是当前最主流的开源 AI 绘画模型,通过文本描述生成高质量图像。为降低使用门槛,开发者推出了多种图形界面(UI)工具,其中AUTOMATIC1111 webUI(简称 “webUI”)和ComfyUI是最受欢迎的两款。二者基于相同的模型内核,但设计理念截然不同:webUI 以直观易用为核心,适合新手快速上手;ComfyUI 则以节点式工作流为特色,提供极致的定制化能力,满足专业用户需求。
二、webUI 与 ComfyUI 核心差异对比
2.1 设计理念与适用人群
维度 | AUTOMATIC1111 webUI | ComfyUI |
---|---|---|
界面形式 | 网页式交互(浏览器访问),按钮 + 表单布局 | 节点式图形界面,通过连接模块构建工作流 |
操作逻辑 | 预设功能模板,参数填空式调节 | 模块化拼接,支持自定义数据流向和算法组合 |
适用人群 | 新手、设计师、内容创作者(追求效率和易用性) | 进阶用户、开发者、科研人员(需要精细控制) |
核心优势 | 插件生态丰富(数千款扩展)、社区教程完善 | 工作流可视化、参数透明化、支持复杂任务串联 |
典型场景 | 快速文生图、风格迁移、日常创作 | 多模型混合推理、ControlNet 堆叠控制、科研实验 |
2.2 关键功能对比
- 出图效率:webUI 通过预设模板实现 “一键生成”,平均出图时间比 ComfyUI 快 10%-20%(相同硬件下);
- 可控性:ComfyUI 支持逐步骤调整采样器、VAE、LoRA 权重等底层参数,例如可单独控制 “降噪强度随步数动态变化”;
- 可复现性:ComfyUI 工作流文件(.json)可直接分享,他人加载后能 100% 复现结果;webUI 需手动记录种子、模型、插件参数。
三、安装方法详解
3.1 webUI 安装(推荐新手)
3.1.1 硬件要求
- GPU:NVIDIA 显卡(RTX 2060 6GB 显存以上,推荐 RTX 3060 8GB+),AMD / 集显需用 CPU 渲染(速度慢 3-5 倍);
- 内存:16GB 以上(8GB 可运行但易卡顿);
- 存储:至少 20GB 空闲空间(含模型和插件)。
3.1.2 安装步骤(Windows 系统)
方法一:整合包安装(最简单)
- 下载秋叶整合包(sd-webui-aki-v4.2),解压至无中文路径的文件夹(如
D:\SD
); - 运行 “启动器运行依赖 - dotnet-6.0.11.exe” 安装依赖;
- 双击 “A 启动器”,点击 “一键启动”,自动下载基础模型(如 v1-5-pruned-emaonly.safetensors,3.9GB);
- 浏览器访问
http://127.0.0.1:7860
进入界面。
方法二:手动安装(适合进阶用户)
- 安装 Python 3.10.6(官网下载,勾选 “Add Python to PATH”);
- 安装 Git(官网下载),默认下一步;
- 打开 cmd,输入以下命令克隆项目:
bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
- 进入
stable-diffusion-webui
文件夹,双击webui-user.bat
,等待依赖安装完成,自动启动界面。
3.1.3 Mac 系统安装
- 安装 Homebrew:
bash
/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
- 安装依赖:
bash
brew install cmake protobuf rust python@3.10 git wget
- 克隆项目并启动:
bash
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui ./webui.sh
3.2 ComfyUI 安装(推荐进阶用户)
3.2.1 硬件要求
- GPU:NVIDIA 显卡(显存 4GB+,推荐 RTX 3060 12GB+),支持 CPU 运行(需添加
--cpu
参数); - 内存:8GB 以上(复杂工作流建议 16GB+);
- 存储:SSD 优先(模型加载速度提升 50%),至少 40GB 空间。
3.2.2 安装步骤(Windows 系统)
方法一:秋叶整合包(新手友好)
- 下载整合包(链接),解压至无中文路径;
- 双击 “绘世启动器.exe”,选择 “ComfyUI”,点击 “一键启动”;
- 自动安装依赖并启动,浏览器访问
http://127.0.0.1:8188
。
方法二:手动安装(原生版)
- 下载压缩包(官网链接);
- 解压后,根据显卡类型双击启动脚本:
- NVIDIA 显卡:
run_nvidia_gpu.bat
- CPU 运行:
run_cpu.bat
- NVIDIA 显卡:
- 安装必备插件(ComfyUI-Manager):
bash
cd ComfyUI/custom_nodes git clone https://github.com/ltdrdata/ComfyUI-Manager.git
- 重启后,通过 Manager 安装汉化插件(搜索 “translation”),设置界面语言为中文。
四、模型类型与应用
4.1 核心模型分类及作用
模型类型 | 功能描述 | 文件格式 | 典型大小 | 存放路径 |
---|---|---|---|---|
Checkpoint(大模型) | 基础生成模型,决定图像风格(如写实、二次元) | .safetensors/.ckpt | 2-8GB | models/Stable-diffusion/ |
VAE(变分自编码器) | 优化色彩和细节(如提亮画面、修复模糊) | .safetensors/.ckpt | 300-800MB | models/VAE/ |
LoRA(低秩适配) | 微调特定风格 / 元素(如 “赛博朋克头盔”“梵高画风”),需搭配大模型使用 | .safetensors/.pt | 10-200MB | models/Lora/ |
Embedding(文本嵌入) | 打包提示词(如 “完美手部”“高清皮肤”),优化关键词权重 | .pt/.bin | 10-100KB | embeddings/ |
ControlNet | 控制图像结构(如线稿转插画、姿态检测),需对应预处理器模型 | .safetensors | 1-3GB | models/ControlNet/ |
4.2 2025 年热门模型推荐
- Checkpoint:
- 写实类:
Realistic Vision V6
(8K 分辨率支持,皮肤质感突出); - 二次元:
MeinaMix V10
(线条流畅,角色表情生动); - 通用类:
Stable Diffusion 3.5 Large
(81 亿参数,支持多模态输入)。
- 写实类:
- LoRA:
Forest Jelly Glow
(添加发光森林水母效果,触发词jellyfishforest
)、Detail Tweaker XL
(提升金属 / 布料纹理细节)。 - VAE:
kl-f8-anime2
(二次元专用,色彩鲜艳)、vae-ft-mse-840000-ema-pruned
(写实类通用)。
五、常用插件推荐
5.1 webUI 必备插件
插件名称 | 核心功能 | 安装地址 |
---|---|---|
ControlNet | 通过线稿 / 姿态 / 深度图控制生成(如 “根据草图生成人物”) | https://github.com/Mikubill/sd-webui-controlnet |
After Detailer | 自动修复人脸 / 手部瑕疵(支持 9 种修复模型,解决 “六指”“面部扭曲” 问题) | https://github.com/Bing-su/adetailer |
Ultimate SD Upscale | 分块放大图像(显存占用降低 40%,支持 4K/8K 输出) | https://github.com/Coyote-A/ultimate-upscale-for-automatic1111 |
TagComplete | 提示词自动补全(支持中文输入,联想 “masterpiece”“8k” 等高频词) | https://github.com/DominikDoom/a1111-sd-webui-tagcomplete |
5.2 ComfyUI 核心插件
插件名称 | 核心功能 | 安装方式 |
---|---|---|
ComfyUI-Manager | 插件 / 模型管理中心(一键安装 / 更新节点,检测缺失依赖) | 克隆至custom_nodes 目录 |
AIGODLIKE-ComfyUI-Translation | 界面汉化(支持多语言切换,节点名称 / 参数提示中文显示) | 通过 Manager 搜索 “translation” 安装 |
ComfyUI-Advanced-ControlNet | 多 ControlNet 堆叠(支持 Canny+Depth+Openpose 同时控制,精度提升 30%) | https://github.com/Kosinkadink/ComfyUI-Advanced-ControlNet |
SDXL Prompt Styler | 内置 70 + 风格模板(如 “蒸汽朋克”“折纸艺术”,自动生成对应提示词) | https://github.com/twri/sdxl_prompt_styler |
六、核心功能深度解析
6.1 webUI 功能亮点
- 文生图(txt2img):支持批量生成(最多 16 张 / 批),内置 “高清修复(Hires.fix)” 一键提升分辨率至 2K/4K;
- 局部重绘(Inpainting):通过画笔涂抹需修改区域,结合提示词精准替换(如 “将背景替换为星空”);
- 模型快速切换:下拉菜单选择大模型 / LoRA,支持 “模型混合”(如 50% 写实 + 50% 二次元风格)。
6.2 ComfyUI 高级功能
- 工作流嵌套:将常用节点组合为 “超级节点”(如 “文生图 + ControlNet+Upscale” 打包为一个模块),简化复杂界面;
- 潜空间操作:直接编辑 Latent(潜变量)数据,实现 “风格插值”(如从 “写实” 平滑过渡到 “动漫”);
- 多模型串联推理:例如 “SDXL 基础模型生成草图 → Flux 模型细化细节 → StableSR 放大至 8K”,全流程节点化控制。
七、总结与选择建议
- 优先选 webUI:如果你是新手、需要快速出图、依赖丰富插件(如换脸、二维码生成),或主要用于社交媒体内容创作;
- 优先选 ComfyUI:如果你需要精细控制生成流程、复现科研实验、分享标准化工作流,或从事专业设计(如游戏原画、影视概念图)。
二者并非对立关系,许多用户会同时安装:用 webUI 处理日常创作,用 ComfyUI 调试复杂效果。随着 Stable Diffusion 3.5 等新版本发布,两款工具的生态正逐步融合,例如 ComfyUI 已支持直接加载 webUI 的插件和模型。