Teaser Teaser Teaser

FLUX.2 [klein] 9B-KV 是 FLUX.2 [klein] 9B 的优化版本，支持 KV 缓存以加速多参考图编辑。该版本在首次去噪步骤中缓存参考图像的键值对，消除后续步骤中的冗余计算，显著加快多图像编辑工作流程。

有关 FLUX.2 [klein] 的更多信息，请阅读我们的博客文章。

核心特性

KV 缓存优化：参考图像的 KV 对只需计算一次并缓存，减少计算量，在多参考图编辑任务中推理速度提升高达 2.5 倍。
具备 FLUX.2 [klein] 9B 的全部功能：亚秒级生成、文本到图像转换，以及单一统一模型中的多参考图编辑。
非常适合交互式应用和实时编辑流水线，尤其适合同一参考图像用于多次生成的场景。
9B 流模型，配备 8B Qwen3 文本嵌入器，通过步数蒸馏优化至 4 步推理。
仅供非商业用途。

KV 缓存工作原理

在标准图像编辑中，参考图像令牌会在每个去噪步骤中被处理。借助 KV 缓存：

步骤 0：完整前向传播处理参考令牌，并将其键值对提取到缓存中。
步骤 1-3：重用缓存的 KV 对，跳过冗余的参考令牌计算。

这在以下场景中尤为有益：

使用多张参考图像进行编辑时
使用相同参考图生成变体时
构建交互式编辑应用时

使用方法

我们在 GitHub 仓库中提供了参考实现。

API 端点

FLUX.2 [klein] 9B-KV 可通过 BFL API 在 bfl.ai 获取。

与 Diffusers 🧨 配合使用

要将 FLUX.2 [klein] 9B-KV 与 🧨 Diffusers Python 库配合使用，请先安装或升级 diffusers：

pip install git+https://github.com/huggingface/diffusers.git

然后您可以使用 Flux2KleinKVPipeline 来运行模型：

import torch
from diffusers import Flux2KleinKVPipeline

device = "cuda"
dtype = torch.bfloat16
model_path = "black-forest-labs/FLUX.2-klein-9b-kv"

pipe = Flux2KleinKVPipeline.from_pretrained(model_path, torch_dtype=dtype)
pipe.to(device)

# Text-to-image (no reference image)
print("Generating text-to-image...")
image = pipe(
    prompt="A cat holding a sign that says hello world",
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image.save("t2i_output.png")
print("Saved t2i_output.png")

# Image-to-image with KV cache (using the generated image as reference)
print("Generating image-to-image with KV cache...")
image_kv = pipe(
    prompt="A cat dressed like a wizard",
    image=image,
    height=1024,
    width=1024,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0),
).images[0]
image_kv.save("kv_output.png")
print("Saved kv_output.png")

局限性

本模型并非旨在提供或无法提供事实性信息。
尽管模型能够生成文本，但生成的文本可能不准确或存在失真情况。
作为统计模型，此检查点可能会体现或放大训练数据中存在的偏见。
模型可能无法生成与提示匹配的输出内容。
提示遵循程度在很大程度上受提示风格的影响。

超出范围的使用

本模型及其衍生产品不得在许可范围外使用，包括用于非法、欺诈、诽谤、滥用或其他违反行为，具体详见我们的使用政策。

硬件要求

FLUX.2 [klein] 9B-KV模型大小约为29GB VRAM，可在NVIDIA RTX 5090及更高配置的显卡上运行。

负责任的AI开发

Black Forest Labs致力于负责任的模型开发与部署。在发布FLUX.2 [klein] 9B-KV之前，我们评估并缓解了多项风险，包括儿童性虐待材料（CSAM）和非自愿私密图像（NCII）。有关我们的缓解措施、评估流程、内容来源特征及政策的详细信息，请参阅我们的文章：Capable, Open, and Safe: Combating AI Misuse。

如报告安全问题，请联系safety@blackforestlabs.ai。

许可协议

本模型遵循FLUX Non-Commercial License。

商标与知识产权

本项目可能包含项目、产品或服务的商标或徽标。在本项目的修改版本中使用Black Forest Labs和FLUX的商标或徽标时，不得引起混淆，也不得暗示获得赞助或认可。任何第三方商标、知识产权或徽标的使用均受第三方政策的约束。