本文仅做测评体验,非广告。
1. FLUX.1简介
FLUX.1是由黑森林实验室(Black Forest Labs)开发的开源AI图像生成模型。它拥有12B(120亿)参数,是迄今为止最大的文生图模型之一。FLUX.1以其卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力而脱颖而出,为AI图像生成设定了新的行业标准。
FLUX.1包含三种变体,以满足不同用户的需求:
- FLUX.1 Pro:顶级性能版本,适合需要最高图像质量和详细输出的商业应用。
- FLUX.1 Dev:开源非商业用途版本,是从FLUX.1 Pro提炼而来,具有类似的质量和提示词能力,同时比相同大小的标准模型更高效。
- FLUX.1 Schnell:快速高效的版本,专为本地开发和个人使用量身定制,在Apache2.0许可下公开可用。它在生成速度上具有明显优势,同时对内存的占用也是最小的。
FLUX.1的竞争力:
- 大规模参数:拥有12B参数,是最大的开源文本到图像模型之一。
- 多模态架构:基于多模态和并行扩散Transformer块的混合架构,提供强大的图像生成能力。
- 高性能变体:提供三种不同性能和用途的模型变体。
- 图像质量:在视觉质量、提示词遵循、大小/纵横比可变性、字体和输出多样性等方面超越了其他流行的模型。
- 开源和可访问性:部分模型变体如FLUX.1 Dev和FLUX.1 Schnell是开源的,易于研究和非商业应用。
- 技术创新:引入了流匹配训练方法、旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。
FLUX.1的应用场景广泛,包括媒体和娱乐、艺术创作与设计、广告和营销、教育和研究以及内容创作等多个领域。它能够帮助用户轻松将创意愿景转化为具体视觉效果,是一个强大的AI图像生成工具。
2. 实战
2. 1 创建资源
在创建页面可以看到丹摩提供了三种付费方式,本教程使用按量付费,如果有长期的需求,可以自行选择包月或包日。
丹摩还提供了非常多种不同层次的配置供选择,这里选用第一种NVIDIA-GeForce-RTX-4090,你可以根据个人需求选择更高的配置。
接着是数据硬盘,默认是100G数据盘和50G数据盘,对于FLUX.1模型,建议将数据盘至少增加至150GB。
安装镜像,选择镜像市场点加号就可以看到许多类型与版本的基础镜像,这些镜像中已经包含了系统与对应的框架环境,开箱即用。这里选用PyTorch2.4.0。
创建密钥对(增加安全性,可跳过)
自定义一个名字后妥善保管下载下来的秘钥文件。
然后选择刚刚创建的密钥对。
最后点击右下角的立即创建就好了。
配置总览:
创建后自动跳转到如下界面,耐心等待创建完成。
创建完成后点击黄字就可以跳转到云实例进行操作了。
进入云实例后选择Terminal
就可以进入到 Linux 的命令行界面,然后就可以进行下一步操作了。
注:进入后先输入
clear
就可以清除系统的红色提示。
2. 1 ComfyUI的部署操作
在命令行中输入以下两个代码中的一个,推荐使用第二个与CSDN合作的 gitcode 的域名,下载比 github 快很多。
# github官方代码仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
# gitCode-github加速计划代码仓库
git clone https://gitcode.com/gh_mirrors/co/ComfyUI.git
输入后回车,等待几秒,出现下图的目录就说明克隆项目成功了。
双击左边的ComfyUI
就可以进入目录。
这里便是ComfyUI
的项目文件。
接下来的操作需要Linux基础,如果你没学过,照做就好。
cd ComfyUI/
pip install -r requirements.txt --root-user-action=ignore
第一行是切换到 ComfyUI
这个目录下。
第二行代码用来下载ComfyUI
所需要的依赖,丹摩会自动使用国内的镜像源去下载,所以还是很快的。
下载完成后,执行:
python main.py --listen
如果出现的是类似这样的信息:
就说明ComfyUI部署完成。
2. 3 部署FLUX.1
在下面的三行代码选取一个:
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar
作用依次为:
- 下载完整FLUX.1-dev模型
- 下载完整FLUX.1-schnell模型
- 下载完整Clip模型
安装之前先按 ctrl+c 退出刚才进入的 python 程序。
这里采用第一个进行安装。
安装包非常大,所以需要耐心等待,不过放心,下载操作发生在云端,不会占用你的带宽。
下载完成后进行解压:
tar -xf FLUX.1-dev.tar
这么大的文件解压也需要挺长时间,出现如下界面时耐心等待,不要进行任何操作。
解压完成后:
接下来移动一些文件到指定的地方:
cd /root/workspace/ComfyUI/FLUX.1-dev
mv flux1-dev.safetensors /root/workspace/ComfyUI/models/unet/
mv ae.safetensors /root/workspace/ComfyUI/models/vae/
- 进入解压后的文件夹。(如果没有解压到这个位置,请自行修改路径)
- 后面两行都是移动文件的位置,不多解释。
cd ../
切换到上级目录(/root/workspace/ComfyUI/
)。
执行:
wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar
等待下载完成后进行解压:
tar -xf flux_text_encoders.tar
解压完成后再次进行文件移动:
cd /root/workspace/ComfyUI/flux_text_encoders
mv clip_l.safetensors /root/workspace/ComfyUI/models/clip/
mv t5xxl_fp16.safetensors /root/workspace/ComfyUI/models/clip/
这样部署就完成了。
3. 测试
执行:
cd /root/workspace/ComfyUI
python main.py --listen
- 切换到项目路径。
- 执行项目。
如果你出现如下报错:
依次执行:
apt-get update
apt-get install lsof
安装lsof
,安装完成后执行:
sudo kill -9 $(sudo lsof -t -i:8188)
这样就能正常运行了:
回到丹摩平台:
输入8188
并创建。
将链接复制下来访问就能进入页面:
点击右侧大大的Load
,加载你的工作流就可以运行了。
5. 释放资源
如果你不打算长期使用创建的实例,一定要释放资源,不然会持续扣费。
4. 结语
在本教程中,我们不仅探索了FLUX.1和ComfyUI的强大功能,还体验了丹摩平台的便捷性和高效性。
丹摩平台以其用户友好的界面、灵活的资源配置和即开即用的便捷性,为用户提供了一个理想的AI开发和部署环境。
谢谢你的阅读,喜欢的话来个点赞收藏评论关注吧!
我会持续更新更多优质文章