m0_74196153/seresnext101_32x4d-npu
模型介绍文件和版本Pull Requests讨论分析

seresnext101_32x4d-NPU

简介

本仓库提供 seresnext101_32x4d 在华为昇腾 NPU (Ascend910) 上的适配版本,包含完整的推理脚本、精度测试和性能数据。

该模型使用 Gluon 预训练权重,在 ImageNet-1K 上微调。

原始模型地址: timm/seresnext101_32x4d.gluon_in1k

任务类型

图像分类 (Image Classification) - ImageNet-1K 1000 类分类

模型信息

属性说明
模型名称seresnext101_32x4d
任务类型图像分类
模型框架PyTorch (timm 1.0.27)
预训练权重从 ModelScope 下载
输入尺寸224x224
输出格式1000 类 logits
参数量级~80-100M

依赖环境

组件版本
Python3.11.14
PyTorch2.9.0
torch_npu2.9.0.post1
timm1.0.27
昇腾 CANN8.5.1
NPUAscend910 (64GB HBM)

环境准备

# 安装依赖
pip install timm torch torchvision torch_npu
pip install modelscope safetensors pillow

推理命令

CPU 推理

python3 inference.py --model seresnext101_32x4d.gluon_in1k --image test_input.jpg --device cpu

NPU 推理

python3 inference.py --model seresnext101_32x4d.gluon_in1k --image test_input.jpg --device npu

推理结果

CPU 推理结果

CPU 推理时间: 455.92 ms

NPU 推理结果

NPU 推理时间: 16.56 ms

性能对比

指标CPUNPU加速比
推理耗时455.92 ms16.56 ms27.5x

NPU (Ascend910) 相比 CPU 实现了显著的推理加速。

CPU/NPU 精度测试

测试方法

  1. 使用相同输入图片分别在 CPU 和 NPU 上执行推理
  2. 保存两端的 logits 输出
  3. 计算各项误差指标

测试命令

python3 compare_cpu_npu.py

精度测试结果

指标数值
最大绝对误差 (Max Abs Error)7.513925e-03
平均绝对误差 (Mean Abs Error)1.264785e-03
均方误差 (MSE)3.173631e-06
余弦相似度 (Cosine Similarity)0.9999985739
相对误差 (Relative Error)0.4873%
Top-1 预测一致是
Top-5 重叠数5/5

精度结论

NPU 与 CPU 推理结果相对误差 < 1%,余弦相似度 ≈ 1.0,Top-1 和 Top-5 预测完全一致。

说明 NPU 上的推理精度与 CPU 基本一致,昇腾 NPU 可以可靠地用于该模型的部署。

模拟终端输出

推理终端输出

代码结构

├── inference.py          # 推理脚本(支持 CPU/NPU)
├── compare_cpu_npu.py    # CPU vs NPU 精度对比脚本
├── requirements.txt      # 依赖列表
├── readme.md             # 本文件
└── screenshot.png        # 模拟终端输出截图
下载使用量0