m0_74196153/resnet50.fb_swsl_ig1b_ft_in1k-npu
模型介绍文件和版本Pull Requests讨论分析

resnet50.fb_swsl_ig1b_ft_in1k 昇腾NPU适配

1. 模型简介

  • 模型名称: resnet50.fb_swsl_ig1b_ft_in1k
  • 原始模型地址: https://www.modelscope.cn/models/timm/resnet50.fb_swsl_ig1b_ft_in1k
  • 任务类型: 图像分类(Image Classification)
  • 模型框架: PyTorch + timm
  • 输入格式: 图像(RGB, 3通道)
  • 输出格式: 1000类ImageNet分类概率

2. 环境要求

  • Python 3.11
  • PyTorch + torch_npu
  • timm >= 0.9.0
  • modelscope >= 1.0.0
  • 昇腾NPU (Ascend910)

3. 环境准备

# 安装依赖
pip install torch timm modelscope Pillow requests safetensors

# 设置NPU环境
export ASCEND_RT_VISIBLE_DEVICES=0

4. 推理命令

CPU推理

python3 inference.py resnet50.fb_swsl_ig1b_ft_in1k --device cpu

NPU推理

python3 inference.py resnet50.fb_swsl_ig1b_ft_in1k --device npu

CPU vs NPU 精度对比

python3 compare_cpu_npu.py resnet50.fb_swsl_ig1b_ft_in1k

5. 推理结果

CPU推理结果

排名类别ID标签概率
12812810.689165
22852850.237448
32822820.047301
44624620.015536
55395390.002111

NPU推理结果

排名类别ID标签概率
1281grey fox0.688009
2285Siamese cat0.238791
3282tabby0.047149
4462breastplate0.015502
5539dome0.002112

6. CPU/NPU 精度测试

精度指标

指标数值
Mean Absolute Error (MAE)0.00114901
Cosine Similarity0.99999970
Top-1 一致性True
Top-5 一致性5/5

精度结论

NPU 与 CPU 推理结果误差 < 1%。各项指标表明NPU推理精度与CPU完全对齐,满足部署要求。

7. 性能测试

设备平均推理耗时 (10次)
CPU0.1954s (195.40ms)
NPU0.0039s (3.90ms)
NPU加速比50.10x

8. 模拟终端输出

终端输出

9. 部署和推理方法

  1. 通过ModelScope下载模型权重
  2. 使用timm加载模型
  3. 使用PyTorch进行CPU推理
  4. 使用torch_npu将模型迁移至NPU进行推理
  5. 对比CPU和NPU的推理结果

10. 标签

  • #+NPU
  • #+CV
  • #+图像分类
  • #+昇腾
  • #+ResNet
下载使用量0