seresnextaa201d_32x8d-NPU

简介

本仓库提供 seresnextaa201d_32x8d 在华为昇腾 NPU (Ascend910) 上的适配版本，包含完整的推理脚本、精度测试和性能数据。

该模型使用 SW (Semantic Weakly-supervised) 方法在 ImageNet-12K 上预训练。

原始模型地址: timm/seresnextaa201d_32x8d.sw_in12k

任务类型

图像分类 (Image Classification) - ImageNet-1K 1000 类分类

模型信息

属性	说明
模型名称	seresnextaa201d_32x8d
任务类型	图像分类
模型框架	PyTorch (timm 1.0.27)
预训练权重	从 ModelScope 下载
输入尺寸	224x224
输出格式	1000 类 logits
参数量级	~200M

依赖环境

组件	版本
Python	3.11.14
PyTorch	2.9.0
torch_npu	2.9.0.post1
timm	1.0.27
昇腾 CANN	8.5.1
NPU	Ascend910 (64GB HBM)

环境准备

# 安装依赖
pip install timm torch torchvision torch_npu
pip install modelscope safetensors pillow

推理命令

CPU 推理

python3 inference.py --model seresnextaa201d_32x8d.sw_in12k --image test_input.jpg --device cpu

NPU 推理

python3 inference.py --model seresnextaa201d_32x8d.sw_in12k --image test_input.jpg --device npu

推理结果

CPU 推理结果

CPU 推理时间: 1739.64 ms

NPU 推理结果

NPU 推理时间: 32.33 ms

性能对比

指标	CPU	NPU	加速比
推理耗时	1739.64 ms	32.33 ms	53.8x

NPU (Ascend910) 相比 CPU 实现了显著的推理加速。

CPU/NPU 精度测试

测试方法

使用相同输入图片分别在 CPU 和 NPU 上执行推理
保存两端的 logits 输出
计算各项误差指标

测试命令

python3 compare_cpu_npu.py

精度测试结果

指标	数值
最大绝对误差 (Max Abs Error)	1.038742e-02
平均绝对误差 (Mean Abs Error)	7.700266e-03
均方误差 (MSE)	5.977838e-05
余弦相似度 (Cosine Similarity)	1.0000000127
相对误差 (Relative Error)	0.0298%
Top-1 预测一致	是
Top-5 重叠数	5/5

精度结论

NPU 与 CPU 推理结果相对误差 < 1%，余弦相似度 ≈ 1.0，Top-1 和 Top-5 预测完全一致。

说明 NPU 上的推理精度与 CPU 基本一致，昇腾 NPU 可以可靠地用于该模型的部署。

模拟终端输出

推理终端输出

代码结构

├── inference.py          # 推理脚本（支持 CPU/NPU）
├── compare_cpu_npu.py    # CPU vs NPU 精度对比脚本
├── requirements.txt      # 依赖列表
├── readme.md             # 本文件
└── screenshot.png        # 模拟终端输出截图

属性

说明

模型名称

seresnextaa201d_32x8d

任务类型

图像分类

模型框架

PyTorch (timm 1.0.27)

预训练权重

从 ModelScope 下载

输入尺寸

224x224

输出格式

1000 类 logits

参数量级

~200M

组件

版本

Python

3.11.14

PyTorch

2.9.0

torch_npu

2.9.0.post1

timm

1.0.27

昇腾 CANN

8.5.1

NPU

Ascend910 (64GB HBM)

指标

CPU

NPU

加速比

推理耗时

1739.64 ms

32.33 ms

53.8x

CPU/NPU 精度测试

测试方法

使用相同输入图片分别在 CPU 和 NPU 上执行推理

保存两端的 logits 输出

计算各项误差指标

测试命令

python3 compare_cpu_npu.py

精度测试结果

指标	数值
最大绝对误差 (Max Abs Error)	1.038742e-02
平均绝对误差 (Mean Abs Error)	7.700266e-03
均方误差 (MSE)	5.977838e-05
余弦相似度 (Cosine Similarity)	1.0000000127
相对误差 (Relative Error)	0.0298%
Top-1 预测一致	是
Top-5 重叠数	5/5

精度结论

NPU 与 CPU 推理结果相对误差 < 1%，余弦相似度 ≈ 1.0，Top-1 和 Top-5 预测完全一致。

说明 NPU 上的推理精度与 CPU 基本一致，昇腾 NPU 可以可靠地用于该模型的部署。

├── inference.py # 推理脚本（支持 CPU/NPU） ├── compare_cpu_npu.py # CPU vs NPU 精度对比脚本 ├── requirements.txt # 依赖列表 ├── readme.md # 本文件 └── screenshot.png # 模拟终端输出截图