m0_74196153/seresnextaa201d_32x8d-npu
模型介绍文件和版本Pull Requests讨论分析

seresnextaa201d_32x8d-NPU

简介

本仓库提供 seresnextaa201d_32x8d 在华为昇腾 NPU (Ascend910) 上的适配版本,包含完整的推理脚本、精度测试和性能数据。

该模型使用 SW (Semantic Weakly-supervised) 方法在 ImageNet-12K 上预训练。

原始模型地址: timm/seresnextaa201d_32x8d.sw_in12k

任务类型

图像分类 (Image Classification) - ImageNet-1K 1000 类分类

模型信息

属性说明
模型名称seresnextaa201d_32x8d
任务类型图像分类
模型框架PyTorch (timm 1.0.27)
预训练权重从 ModelScope 下载
输入尺寸224x224
输出格式1000 类 logits
参数量级~200M

依赖环境

组件版本
Python3.11.14
PyTorch2.9.0
torch_npu2.9.0.post1
timm1.0.27
昇腾 CANN8.5.1
NPUAscend910 (64GB HBM)

环境准备

# 安装依赖
pip install timm torch torchvision torch_npu
pip install modelscope safetensors pillow

推理命令

CPU 推理

python3 inference.py --model seresnextaa201d_32x8d.sw_in12k --image test_input.jpg --device cpu

NPU 推理

python3 inference.py --model seresnextaa201d_32x8d.sw_in12k --image test_input.jpg --device npu

推理结果

CPU 推理结果

CPU 推理时间: 1739.64 ms

NPU 推理结果

NPU 推理时间: 32.33 ms

性能对比

指标CPUNPU加速比
推理耗时1739.64 ms32.33 ms53.8x

NPU (Ascend910) 相比 CPU 实现了显著的推理加速。

CPU/NPU 精度测试

测试方法

  1. 使用相同输入图片分别在 CPU 和 NPU 上执行推理
  2. 保存两端的 logits 输出
  3. 计算各项误差指标

测试命令

python3 compare_cpu_npu.py

精度测试结果

指标数值
最大绝对误差 (Max Abs Error)1.038742e-02
平均绝对误差 (Mean Abs Error)7.700266e-03
均方误差 (MSE)5.977838e-05
余弦相似度 (Cosine Similarity)1.0000000127
相对误差 (Relative Error)0.0298%
Top-1 预测一致是
Top-5 重叠数5/5

精度结论

NPU 与 CPU 推理结果相对误差 < 1%,余弦相似度 ≈ 1.0,Top-1 和 Top-5 预测完全一致。

说明 NPU 上的推理精度与 CPU 基本一致,昇腾 NPU 可以可靠地用于该模型的部署。

模拟终端输出

推理终端输出

代码结构

├── inference.py          # 推理脚本(支持 CPU/NPU)
├── compare_cpu_npu.py    # CPU vs NPU 精度对比脚本
├── requirements.txt      # 依赖列表
├── readme.md             # 本文件
└── screenshot.png        # 模拟终端输出截图
下载使用量0