| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| timm | 1.0.27 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
python inference.py --device npu:0 --dtype float32模型: cv_resnet50d.a1_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成
--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [-8.865221 -5.354324 -5.5568113 -5.2209916 -4.8285522]
是否有 NaN: False
预测类别: 111
--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [-8.863442 -5.353367 -5.550495 -5.2192764 -4.8271546]
是否有 NaN: False
预测类别: 111
--- 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.010394
--- 性能基准 ---
平均延迟: 5.28 ms (10轮)
✓ 推理完成| 指标 | 数值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 最大绝对误差 | 0.010394 |
| 预测类别一致 | 是 (111) |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 5.28 ms |
| 测试轮数 | 10 |