Teaser Teaser Teaser

FLUX.2 [klein] 9B-KV 是 FLUX.2 [klein] 9B 的优化版本，具备KV缓存支持，可加速多参考图编辑。该版本在首次去噪步骤中缓存参考图像的键值对，消除后续步骤中的冗余计算，显著加快多图像编辑工作流程。

有关 FLUX.2 [klein] 的更多信息，请阅读我们的博客文章。

核心特性

KV缓存优化：参考图像的KV对只需计算一次并缓存，减少计算量，在多参考图编辑任务中推理速度提升高达2.5倍。
具备 FLUX.2 [klein] 9B 的所有功能：亚秒级生成、文本到图像转换，以及在单一统一模型中实现多参考图编辑。
非常适合交互式应用和实时编辑流水线，尤其是在多个生成过程中使用相同参考图像的场景。
9B 流模型，搭配 8B Qwen3 文本编码器，经步数蒸馏后仅需4步推理。
可供非商业用途使用。

KV缓存工作原理

在标准图像编辑中，参考图像令牌会在每个去噪步骤中被处理。借助KV缓存：

步骤0：完整前向传播处理参考令牌，并将其键值对提取到缓存中。
步骤1-3：复用缓存的KV对，跳过冗余的参考令牌计算。

这在以下情况中尤为有益：

使用多张参考图像进行编辑时
使用相同参考图像生成变体时
构建交互式编辑应用时

使用方法

我们在 GitHub 仓库中提供了参考实现。

API 端点

FLUX.2 [klein] 9B-KV 可通过 BFL API 在 bfl.ai 获取。

局限性

本模型并非旨在提供或无法提供事实性信息。
尽管模型能够输出文本，但生成的文本可能不准确或存在失真。
作为统计模型，此检查点可能会体现或放大训练数据中观察到的偏见。
模型可能无法生成与提示匹配的输出。
对提示的遵循程度在很大程度上受提示风格的影响。

超出范围的使用

本模型及其衍生产品不得在许可范围外使用，包括用于非法、欺诈、诽谤、滥用或其他违反我们使用政策中进一步说明的目的。

硬件要求

FLUX.2 [klein] 9B-KV 模型需要约 29GB 的显存，可在 NVIDIA RTX 5090 及更高版本的显卡上运行。

负责任的 AI 开发

黑森林实验室（Black Forest Labs）致力于负责任的模型开发和部署。在发布 FLUX.2 [klein] 9B-KV 之前，我们评估并缓解了多项风险，包括儿童性虐待材料（CSAM）和非自愿私密图像（NCII）。有关我们的缓解措施、评估流程、内容来源特征和政策的详细信息，请参阅我们的文章：Capable, Open, and Safe: Combating AI Misuse。

如要报告安全问题，请联系 safety@blackforestlabs.ai。

许可协议

本模型遵循 FLUX Non-Commercial License。

商标与知识产权

本项目可能包含项目、产品或服务的商标或徽标。在本项目的修改版本中使用 Black Forest Labs 和 FLUX 的商标或徽标时，不得引起混淆，也不得暗示赞助或认可。任何第三方商标、知识产权或徽标的使用均受第三方政策的约束。

核心特性

KV缓存优化：参考图像的KV对只需计算一次并缓存，减少计算量，在多参考图编辑任务中推理速度提升高达2.5倍。

具备 FLUX.2 [klein] 9B 的所有功能：亚秒级生成、文本到图像转换，以及在单一统一模型中实现多参考图编辑。

非常适合交互式应用和实时编辑流水线，尤其是在多个生成过程中使用相同参考图像的场景。

9B 流模型，搭配 8B Qwen3 文本编码器，经步数蒸馏后仅需4步推理。

可供非商业用途使用。

KV缓存工作原理

在标准图像编辑中，参考图像令牌会在每个去噪步骤中被处理。借助KV缓存：

步骤0：完整前向传播处理参考令牌，并将其键值对提取到缓存中。

步骤1-3：复用缓存的KV对，跳过冗余的参考令牌计算。

这在以下情况中尤为有益：

使用多张参考图像进行编辑时

使用相同参考图像生成变体时

构建交互式编辑应用时

局限性

本模型并非旨在提供或无法提供事实性信息。

尽管模型能够输出文本，但生成的文本可能不准确或存在失真。

作为统计模型，此检查点可能会体现或放大训练数据中观察到的偏见。

模型可能无法生成与提示匹配的输出。

对提示的遵循程度在很大程度上受提示风格的影响。

负责任的 AI 开发

如要报告安全问题，请联系 safety@blackforestlabs.ai。