模型: black-forest-labs/FLUX.2-small-decoder
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输入形状: [1, 32, 64, 64]
输出形状: [1, 3, 512, 512]
输出前5个值: [ 0.00682809 -0.026568 -0.10946923 -0.11549806 -0.17874204]
是否有 NaN: False
--- NPU 推理 (npu:0) ---
输入形状: [1, 32, 64, 64]
输出形状: [1, 3, 512, 512]
输出前5个值: [ 0.00678159 -0.02662103 -0.1094844 -0.11551054 -0.17876516]
是否有 NaN: False
--- 精度对比 ---
Cosine Similarity: 1.000005
Max Abs Error: 0.000922
--- 性能基准 ---
平均延迟: 30.25 ms (10轮)
✓ 推理完成