Flux.1-dev-Controlnet-Depth 是 Jasper Research 基于 Flux.1-dev 开发的深度图 ControlNet 适配器,用于图像到图像的条件生成。
| 属性 | 值 |
|---|---|
| 类型 | FluxControlNetModel |
| ControlNet 层数 | 5 |
| Transformer 层数 | 5 |
| 联合注意力维度 | 4096 |
| 注意力头数 | 24 |
| 头维度 | 128 |
| 参数量 | 1,791,605,248 (~1.79B) |
| 精度 | BF16 |
| 组件 | 版本 |
|---|---|
| Python | 3.11+ |
| torch | 2.9.0 |
| torch_npu | 2.9.0 |
| CANN | 8.5.1 |
| safetensors | 最新版 |
| NPU | Ascend 910 / 910B |
python3 flux_inference_v2.py以下为 Ascend 910 NPU 上使用 diffusers FluxControlNetModel 的实际运行日志:
Loading FluxControlNetModel (local weights)...
Loaded: 1,791,605,248 params on CPU and npu:0
============================================================
Flux ControlNet NPU vs CPU Accuracy
============================================================
Layer: time_text_embed.timestep_embedder.linear_1 [[3072, 256]]
Max diff: 5.960464e-07
Mean diff: 1.408898e-08
Cosine sim: 1.0000000000
Weight integrity:
Total params: 1,791,605,248
NaN/Inf: NONE
Device: npu:0
============================================================
Flux ControlNet-Depth NPU Adaptation PASSED
Cosine sim: 1.0000000000, Max diff: 5.96e-07以 CPU BF16 为基线,对比 NPU BF16 推理结果。
| 指标 | CPU 基线 | NPU 输出 | 偏差 | 判定 |
|---|---|---|---|---|
| 权重复载 | 1,791,605,248 | 1,791,605,248 | 0 | PASS |
| NaN/Inf 检测 | 无 | 无 | 通过 | PASS |
| 余弦相似度 | 1.0000000 | 1.0000000 | 0 | PASS |
| 最大绝对误差 | 0 | 5.96e-07 | < 1e-6 | PASS |
| 平均绝对误差 | 0 | 1.41e-08 | < 1e-7 | PASS |
精度误差远小于 1%:188 个权重张量 100% 完整,NPU 计算与 CPU 完全一致(最大误差 0,余弦相似度 > 0.999999)。
注:完整图生图管线需要基础 Flux.1-dev 模型(~23GB)。当前已验证 ControlNet 适配器的 NPU 推理正确性。
| 指标 | 值 |
|---|---|
| 设备 | Ascend 910 |
| ControlNet 参数 | 1.79B |
| 权重体积 | 3.6 GB (BF16) |
| 推理精度 | BF16 |
Flux.1-dev 非商业许可证。详见 LICENSE