| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| timm | 1.0.27 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
python inference.py --device npu:0 --dtype float32模型: cv_resnet50_gn.a1h_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [-14.920034 -14.057735 -12.968552 -13.203744 -12.342465]
是否有 NaN: False
预测类别: 735
--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [-14.922246 -14.061189 -12.971656 -13.206538 -12.344978]
是否有 NaN: False
预测类别: 735
--- 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.005344
--- 性能基准 ---
平均延迟: 5.22 ms (10轮)
✓ 推理完成| 指标 | 数值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 最大绝对误差 | 0.005344 |
| 预测类别一致 | 是 (735) |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 5.22 ms |
| 测试轮数 | 10 |