Comparison Panel

FLUX.2 Small Decoder 是一个蒸馏版 VAE 解码器，可作为标准 FLUX.2 解码器的即插即用替代品。它能实现更快的解码速度和更低的显存占用，同时质量损失微乎其微甚至为零。编码器保持不变。

核心特性

解码速度提升约 1.4 倍，相比完整解码器。
解码时显存占用减少约 1.4 倍，可在不耗尽内存的情况下支持更高分辨率。
解码器参数约 2800 万（完整解码器约 5000 万），这得益于更窄的通道宽度（[96, 192, 384, 384] 对比 [128, 256, 512, 512]）。
质量损失极小——生成图像几乎完全一致。
采用 Apache 2.0 许可证。

兼容所有开源 FLUX.2 模型：

对比

完整解码器	小型解码器

使用方法

pip install git+https://github.com/huggingface/diffusers.git

import torch
from diffusers import Flux2KleinPipeline, AutoencoderKLFlux2

device = "cuda"
dtype = torch.bfloat16

vae = AutoencoderKLFlux2.from_pretrained("black-forest-labs/FLUX.2-small-decoder", torch_dtype=dtype)
pipe = Flux2KleinPipeline.from_pretrained("black-forest-labs/FLUX.2-klein-4B", vae=vae, torch_dtype=dtype)
pipe.enable_model_cpu_offload()

prompt = "A black cat holding a sign that says 'hello world' in typewriter font"
image = pipe(
    prompt=prompt,
    height=1024,
    width=1024,
    guidance_scale=1.0,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0)
).images[0]
image.save("flux-klein-small-decoder.png")

局限性

本模型并非旨在提供或无法提供事实信息。
尽管模型能够输出文本，但生成的文本可能不准确或存在失真。
作为统计模型，此检查点可能会体现或放大训练数据中存在的偏见。
模型可能无法生成与提示内容相符的输出。
提示遵循度在很大程度上受提示风格的影响。

超出范围的使用

本模型及其衍生产品不得在许可范围外使用，包括用于非法、欺诈、诽谤、滥用或其他违反规定的目的，详见我们的使用政策。

负责任的AI开发

Black Forest Labs 致力于负责任的模型开发与部署。在发布 FLUX.2 [klein] 9B-KV 之前，我们评估并缓解了多项风险，包括儿童性虐待材料（CSAM）和非自愿私密图像（NCII）。有关我们的缓解措施、评估流程、内容来源特征及政策的详细信息，请参阅我们的文章：Capable, Open, and Safe: Combating AI Misuse。

如报告安全问题，请联系 safety@blackforestlabs.ai。

许可协议

本模型根据 https://www.apache.org/licenses/LICENSE-2.0 许可协议授权。

商标与知识产权

本项目可能包含项目、产品或服务的商标或徽标。在本项目的修改版本中使用 Black Forest Labs 和 FLUX 的商标或徽标，不得引起混淆，也不得暗示赞助或背书。任何第三方商标、知识产权或徽标的使用均受第三方政策的约束。

核心特性

解码速度提升约 1.4 倍，相比完整解码器。

解码时显存占用减少约 1.4 倍，可在不耗尽内存的情况下支持更高分辨率。

解码器参数约 2800 万（完整解码器约 5000 万），这得益于更窄的通道宽度（[96, 192, 384, 384] 对比 [128, 256, 512, 512]）。

质量损失极小——生成图像几乎完全一致。

采用 Apache 2.0 许可证。

兼容所有开源 FLUX.2 模型：

完整解码器

小型解码器

使用方法

pip install git+https://github.com/huggingface/diffusers.git

import torch
from diffusers import Flux2KleinPipeline, AutoencoderKLFlux2

device = "cuda"
dtype = torch.bfloat16

vae = AutoencoderKLFlux2.from_pretrained("black-forest-labs/FLUX.2-small-decoder", torch_dtype=dtype)
pipe = Flux2KleinPipeline.from_pretrained("black-forest-labs/FLUX.2-klein-4B", vae=vae, torch_dtype=dtype)
pipe.enable_model_cpu_offload()

prompt = "A black cat holding a sign that says 'hello world' in typewriter font"
image = pipe(
    prompt=prompt,
    height=1024,
    width=1024,
    guidance_scale=1.0,
    num_inference_steps=4,
    generator=torch.Generator(device=device).manual_seed(0)
).images[0]
image.save("flux-klein-small-decoder.png")

局限性

本模型并非旨在提供或无法提供事实信息。

尽管模型能够输出文本，但生成的文本可能不准确或存在失真。

作为统计模型，此检查点可能会体现或放大训练数据中存在的偏见。

模型可能无法生成与提示内容相符的输出。

提示遵循度在很大程度上受提示风格的影响。

负责任的AI开发