HuggingFace镜像/FLUX.2-klein-9b-kv-fp8
模型介绍文件和版本分析
下载使用量0

Teaser Teaser Teaser

FLUX.2 [klein] 9B-KV 是 FLUX.2 [klein] 9B 的优化版本,具备KV缓存支持,可加速多参考图编辑。该版本在首次去噪步骤中缓存参考图像的键值对,消除后续步骤中的冗余计算,显著加快多图像编辑工作流程。

有关 FLUX.2 [klein] 的更多信息,请阅读我们的博客文章。

核心特性

  1. KV缓存优化:参考图像的KV对只需计算一次并缓存,减少计算量,在多参考图编辑任务中推理速度提升高达2.5倍。
  2. 具备 FLUX.2 [klein] 9B 的所有功能:亚秒级生成、文本到图像转换,以及在单一统一模型中实现多参考图编辑。
  3. 非常适合交互式应用和实时编辑流水线,尤其是在多个生成过程中使用相同参考图像的场景。
  4. 9B 流模型,搭配 8B Qwen3 文本编码器,经步数蒸馏后仅需4步推理。
  5. 可供非商业用途使用。

KV缓存工作原理

在标准图像编辑中,参考图像令牌会在每个去噪步骤中被处理。借助KV缓存:

  • 步骤0:完整前向传播处理参考令牌,并将其键值对提取到缓存中。
  • 步骤1-3:复用缓存的KV对,跳过冗余的参考令牌计算。

这在以下情况中尤为有益:

  • 使用多张参考图像进行编辑时
  • 使用相同参考图像生成变体时
  • 构建交互式编辑应用时

使用方法

我们在 GitHub 仓库 中提供了参考实现。

API 端点

FLUX.2 [klein] 9B-KV 可通过 BFL API 在 bfl.ai 获取。


局限性

  • 本模型并非旨在提供或无法提供事实性信息。
  • 尽管模型能够输出文本,但生成的文本可能不准确或存在失真。
  • 作为统计模型,此检查点可能会体现或放大训练数据中观察到的偏见。
  • 模型可能无法生成与提示匹配的输出。
  • 对提示的遵循程度在很大程度上受提示风格的影响。

超出范围的使用

本模型及其衍生产品不得在许可范围外使用,包括用于非法、欺诈、诽谤、滥用或其他违反我们使用政策中进一步说明的目的。

硬件要求

FLUX.2 [klein] 9B-KV 模型需要约 29GB 的显存,可在 NVIDIA RTX 5090 及更高版本的显卡上运行。


负责任的 AI 开发

黑森林实验室(Black Forest Labs)致力于负责任的模型开发和部署。在发布 FLUX.2 [klein] 9B-KV 之前,我们评估并缓解了多项风险,包括儿童性虐待材料(CSAM)和非自愿私密图像(NCII)。有关我们的缓解措施、评估流程、内容来源特征和政策的详细信息,请参阅我们的文章:Capable, Open, and Safe: Combating AI Misuse。

如要报告安全问题,请联系 safety@blackforestlabs.ai。


许可协议

本模型遵循 FLUX Non-Commercial License。

商标与知识产权

本项目可能包含项目、产品或服务的商标或徽标。在本项目的修改版本中使用 Black Forest Labs 和 FLUX 的商标或徽标时,不得引起混淆,也不得暗示赞助或认可。任何第三方商标、知识产权或徽标的使用均受第三方政策的约束。