xujiashuai/timm-cv_resnet50.ra_in1k
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

resnet50.ra_in1k 在昇腾 NPU 上的表现

1. 简介

  • 模型来源:timm/resnet50.ra_in1k
  • 架构:ResNet-50(随机增强)
  • 参数量:约 25.6M
  • 任务:图像分类(ImageNet-1K,1000 类)
  • 适配状态:成功

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
timm1.0.27
CANN8.5.1
NPUAscend 910B4

3. 推理脚本

python inference.py --device npu:0 --dtype float32

4. 推理输出证据

模型: cv_resnet50.ra_in1k
设备: npu:0
精度: float32
------------------------------------------------------------
权重加载完成

--- CPU 推理 ---
输出形状: [1, 1000]
Logits 前5个: [ 0.08516952 -0.09885646  0.22529253  0.05488919  0.39560834]
是否有 NaN: False
预测类别: 885

--- NPU 推理 (npu:0) ---
输出形状: [1, 1000]
Logits 前5个: [ 0.08551034 -0.09893969  0.22524284  0.05495771  0.39558825]
是否有 NaN: False
预测类别: 885

--- 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.000839

--- 性能基准 ---
平均延迟: 5.13 ms (10轮)

✓ 推理完成

5. CPU 与 NPU 精度对比

指标数值
余弦相似度1.000000
最大绝对误差0.000839
预测类别一致是 (885)

6. 性能参考

指标数值
平均延迟5.13 ms
测试轮数10