| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| timm | 1.0.27 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
python inference.py --device npu:0 --dtype float32模型: cv_resnet50.ram_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [-0.6966935 0.13176385 0.4762723 0.21876141 0.9400802 ]
是否有 NaN: False
预测类别: 21
--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [-0.696677 0.13168687 0.47622067 0.21850774 0.93940556]
是否有 NaN: False
预测类别: 21
--- 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.000860
--- 性能基准 ---
平均延迟: 5.21 ms (10轮)
✓ 推理完成| 指标 | 数值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 最大绝对误差 | 0.000860 |
| 预测类别一致 | 是 (21) |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 5.21 ms |
| 测试轮数 | 10 |