🤗 HuggingFace |
🤖 ModelScope |
🖥️ Demo |
📄 技术报告
🔥 FireRed-Image-Edit-1.1
我们推出了FireRed-Image-Edit-1.1,这是我们通用图像编辑基础模型的升级版。在FireRed-Image-Edit-1.0技术报告所展示的能力基础上,1.1版本显著增强了身份一致性、多图像条件控制以及特定领域的编辑性能,使模型更贴近现实世界的创意生产需求。
✨ 核心特性
卓越的编辑性能
- 🆔 业界领先的身份一致性:开源领域在人物身份保持方面的最佳水平,确保主体在复杂编辑过程中依然可被清晰识别。
- 🧩 多元素融合:借助智能代理(Agent)驱动的自动裁剪与拼接功能,可自由组合10种以上元素,无需再为简短提示词而困扰。
- 💄 全面的人像美妆:涵盖数十种风格,从专业美容修饰、黄/橄榄肤色提亮,到万圣节女巫妆及创意妆容。
- 📝 文本风格参考:保持高保真的排版和风格化文本,效果可与闭源解决方案相媲美。
- 🖼️ 专业照片修复:高质量的老照片修复与增强,具备卓越的细节恢复能力。
极致的工程优化
- 🔧 开放的LoRA训练生态:发布完整训练代码,支持自定义风格创建;优化的采样器在相同任务、尺寸和输入数量下,可最大限度提升GPU效率。
- ⚡ 极致速度优化:完整的加速套件,融合模型蒸馏、量化和静态编译技术——仅需30GB显存即可实现4.5秒端到端生成。
- 🤖 智能代理工作流:自动化多图像处理,轻松应对如虚拟试穿等复杂构图,无需冗长的提示词工程。
- 🔌 通用部署能力:原生支持ComfyUI节点,并兼容GGUF轻量级格式,实现无缝的生产环境集成。
🎨 效果展示
以下是FireRed-Image-Edit在通用编辑场景下生成的部分真实输出结果。
🏆 评估结果
FireRed-Image-Edit 在 Imgedit、Gedit 和 RedEdit 等开源模型中树立了新的技术标杆,同时在特定维度上超越了闭源竞品——这一优势通过人类评估进一步得到证实,评估结果显示其在 prompt 遵循度和视觉一致性方面表现更为出色。