HuggingFace镜像/HiDream-O1-Image-FP8
模型介绍文件和版本分析
下载使用量0

HiDream-O1-Image — FP8 混合精度(ComfyUI)

这是 HiDream-O1-Image 的FP8 混合精度量化版本,适用于ComfyUI。通过量化为 8 位浮点数,该模型可轻松适配约 10 GB 的显存,使得 12 GB 显存的 GPU(如 RTX 3080/4070/4080 等)能够运行,且质量损失极小。

image

自定义 ComfyUI 节点: Saganaki22/HiDream_O1-ComfyUI

Screenshot 2026-05-10 005045


显存要求

精度大致显存占用
BF1617 – 20 GB
FP1617 – 20 GB
FP8 混合精度(本仓库)~10 GB

对于显存小于 16 GB 的 GPU,推荐使用此版本。已在 12 GB 显存的显卡上测试过 2048 × 2048 分辨率。

什么是 FP8 混合精度? 权重以 float8_e4m3fn 格式存储。敏感层(如归一化层、嵌入层、输出头)保留更高精度以确保稳定性,因此称为“混合精度”。在具备 Hopper 或 Ada Lovelace 架构的 CUDA 显卡(RTX 40xx 系列、H100)上,FP8 计算可利用硬件加速。在较旧的 GPU 上,权重会动态反量化,虽然仍能节省显存,但会有小幅速度损失。


快速开始 — ComfyUI

1. 安装自定义节点

cd ComfyUI/custom_nodes
git clone https://github.com/Saganaki22/HiDream_O1-ComfyUI
pip install -r HiDream_O1-ComfyUI/requirements.txt

也可以通过 ComfyUI Manager 进行安装,搜索 HiDream O1 即可。

2. 下载权重

huggingface-cli download drbaph/HiDream-O1-Image-FP8 \
    --local-dir ComfyUI/models/diffusion_models/HiDream-O1-Image-fp8

3. 在 ComfyUI 中加载

打开 ComfyUI 并使用自定义节点仓库中提供的工作流。将模型加载器指向 HiDream-O1-Image-fp8。


关于 HiDream-O1-Image

HiDream-O1-Image 是一款原生统一的图像生成基础模型,它构建于像素级统一Transformer(UiT) 之上——无需外部 VAE,无需分离的文本编码器。它在单一共享令牌空间中对原始像素、文本和特定任务条件进行编码,支持:

  • 文本到图像生成,分辨率高达 2,048 × 2,048
  • 基于指令的图像编辑
  • 主体驱动的个性化(多参考 IP)
  • 长文本和多语言文本渲染

仅需 90 亿参数,它即可媲美甚至超越许多更大规模的开源 DiT 以及领先的闭源模型。它在 “Artificial Analysis 文本到图像竞技场”(2026-05-05)中首次亮相便获得第 8 名。


主要特性

  • 🧬 像素级统一 Transformer — 基于原始像素端到端处理,无 VAE,无分离文本编码器
  • 🎨 一模型,多任务 — 文本到图像生成、编辑、个性化、故事板生成
  • 🧠 推理驱动的提示代理 — 内置“思考”代理,在生成前解决布局和渲染问题
  • 🖼️ 原生高分辨率 — 直接合成高达 2,048 × 2,048 的图像
  • ⚡ 90 亿参数 — 性能与规模大得多的模型相当
  • 💾 FP8 量化 — 显存占用约为全精度版本的一半,质量损失极小

模型变体

仓库精度显存推理步数
drbaph/HiDream-O1-Image-BF16BF1617–20 GB50
drbaph/HiDream-O1-Image-FP16FP1617–20 GB50
drbaph/HiDream-O1-Image-FP8 (本仓库)FP8 混合~10 GB50
HiDream-ai/HiDream-O1-Image原始—50
HiDream-ai/HiDream-O1-Image-Dev原始开发版—28

基准测试结果(来自原始模型)

GenEval(组合生成)——在90亿参数规模下,HiDream-O1-Image的总体得分为0.90,仅次于2000亿参数以上的Pro变体,并领先于GPT Image 2(0.89)。

DPG-Bench(密集提示对齐)——总体得分89.83,排名第二,仅次于Pro变体。

HPSv3(人类偏好)——总体得分10.37,性能优于GPT Image 2(10.21)和Nano Banana 2.0(10.01)。


许可证

原始HiDream-O1-Image模型及代码基于MIT许可证发布。本FP8量化版本继承相同许可证。


链接

  • 🔗 原始模型:HiDream-ai/HiDream-O1-Image
  • 🔧 ComfyUI节点:Saganaki22/HiDream_O1-ComfyUI
  • 📑 技术报告:HiDream-O1-Image.pdf
  • 🤗 在线演示:HiDream-O1-Image Space