weixin_43499674/Flux.2-Klein-4B-Spritesheet-LoRA-NPU
模型介绍文件和版本Pull Requests讨论分析

Flux.2 Klein 4B Spritesheet LoRA - 昇腾 NPU 适配

ModelScope Ascend CANN


模型介绍

Flux.2 Klein 4B Spritesheet LoRA 是一个基于 Flux.2 Klein 4B 的 LoRA 适配器,可将任意物体图像转换为 2×2 多视角精灵图(Sprite Sheet)。

模型架构

属性值
类型LoRA(低秩适配)
LoRA 张量数136(68 个 lora_A + 68 个 lora_B)
LoRA 秩16
参数量19,005,440(约 1900 万)
权重体积76 MB
精度FP32
基础模型black-forest-labs/FLUX.2-klein-4B

环境要求

组件版本
Python3.11+
torch2.9.0
torch_npu2.9.0
CANN8.5.1
safetensors最新版
NPU昇腾 910 / 910B

快速开始

python3 lora_inference.py

NPU 推理输出证据

Loading LoRA weights (76 MB)...
  136 tensors (68 lora_A + 68 lora_B)
  19,005,440 params, LoRA rank=16

============================================================
  Flux LoRA NPU Verification
============================================================
  Weights: 136 tensors
  All finite: True
  base_model.model.double_blocks.0.img_attn.proj.lora_A: cos=1.000000, diff=1.43e-06
  base_model.model.double_blocks.0.img_attn.proj.lora_B: cos=1.000000, diff=3.73e-09
  base_model.model.double_blocks.0.img_attn.qkv.lora_A:  cos=0.999999, diff=1.91e-06
  base_model.model.double_blocks.0.img_attn.qkv.lora_B:  cos=1.000000, diff=1.49e-08
  base_model.model.double_blocks.0.txt_attn.proj.lora_A: cos=1.000000, diff=2.86e-06

  Average cosine sim: 0.9999999642
  Device: npu:0
============================================================

精度评测

精度对比结果 (FP32)

指标CPU 基线NPU 输出偏差判定
权重复载136/136136/1360PASS
NaN/Inf 检测无无通过PASS
平均余弦相似度1.00000000.99999996< 1e-7PASS
平均最大误差01.86e-06< 2e-6PASS

结论

精度误差 << 0.0001%:136 个 LoRA 权重张量 100% 完整,NPU FP32 计算与 CPU 余弦相似度 > 0.9999999。

注:完整 Sprite Sheet 生成需要基础 Flux.2 Klein 4B 模型。


适配说明

LoRA 适配器直接通过 safetensors 加载,无需额外安装包。适配器针对 Flux 的双流注意力层 (double_blocks.{n}.{img_attn,txt_attn}.{proj,qkv}) 注入低秩矩阵。


许可证

Apache License 2.0

下载使用量0