| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| timm | 1.0.27 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
python inference.py --device npu:0 --dtype float32模型: cv_resnet50d.gluon_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [-1.0614568 -0.24489401 -0.613368 0.09714948 0.8675443 ]
是否有 NaN: False
预测类别: 591
--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [-1.0616417 -0.24496754 -0.61335903 0.09731174 0.867788 ]
是否有 NaN: False
预测类别: 591
--- 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.001875
--- 性能基准 ---
平均延迟: 5.29 ms (10轮)
✓ 推理完成| 指标 | 数值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 最大绝对误差 | 0.001875 |
| 预测类别一致 | 是 (591) |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 5.29 ms |
| 测试轮数 | 10 |