| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| timm | 1.0.27 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
python inference.py --device npu:0 --dtype float32模型: cv_mobilenetv3_small_100.lamb_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [-1.6404248 0.88629806 -0.27953976 -1.2183887 -0.7797187 ]
是否有 NaN: False
预测类别: 858
--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [-1.6431292 0.88953257 -0.28033447 -1.2165248 -0.7790787 ]
是否有 NaN: False
预测类别: 858
--- 精度对比 ---
Cosine Similarity: 0.999999
Max Abs Error: 0.007134
--- 性能基准 ---
平均延迟: 4.49 ms (10轮)
✓ 推理完成| 指标 | 数值 |
|---|---|
| 余弦相似度 | 0.999999 |
| 最大绝对误差 | 0.007134 |
| 预测类别一致 | 是 (858) |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 4.49 ms |
| 测试轮数 | 10 |