本仓库提供 seresnext101_32x8d 在华为昇腾 NPU (Ascend910) 上的适配版本,包含完整的推理脚本、精度测试和性能数据。
该模型使用 AH (Advanced Head) 方法在 ImageNet-1K 上训练。
原始模型地址: timm/seresnext101_32x8d.ah_in1k
图像分类 (Image Classification) - ImageNet-1K 1000 类分类
| 属性 | 说明 |
|---|---|
| 模型名称 | seresnext101_32x8d |
| 任务类型 | 图像分类 |
| 模型框架 | PyTorch (timm 1.0.27) |
| 预训练权重 | 从 ModelScope 下载 |
| 输入尺寸 | 224x224 |
| 输出格式 | 1000 类 logits |
| 参数量级 | ~80-100M |
| 组件 | 版本 |
|---|---|
| Python | 3.11.14 |
| PyTorch | 2.9.0 |
| torch_npu | 2.9.0.post1 |
| timm | 1.0.27 |
| 昇腾 CANN | 8.5.1 |
| NPU | Ascend910 (64GB HBM) |
# 安装依赖
pip install timm torch torchvision torch_npu
pip install modelscope safetensors pillowpython3 inference.py --model seresnext101_32x8d.ah_in1k --image test_input.jpg --device cpupython3 inference.py --model seresnext101_32x8d.ah_in1k --image test_input.jpg --device npuCPU 推理时间: 837.72 ms
NPU 推理时间: 15.89 ms
| 指标 | CPU | NPU | 加速比 |
|---|---|---|---|
| 推理耗时 | 837.72 ms | 15.89 ms | 52.7x |
NPU (Ascend910) 相比 CPU 实现了显著的推理加速。
python3 compare_cpu_npu.py| 指标 | 数值 |
|---|---|
| 最大绝对误差 (Max Abs Error) | 6.192684e-03 |
| 平均绝对误差 (Mean Abs Error) | 2.876304e-03 |
| 均方误差 (MSE) | 9.735936e-06 |
| 余弦相似度 (Cosine Similarity) | 0.9999999567 |
| 相对误差 (Relative Error) | 0.0719% |
| Top-1 预测一致 | 是 |
| Top-5 重叠数 | 5/5 |
NPU 与 CPU 推理结果相对误差 < 1%,余弦相似度 ≈ 1.0,Top-1 和 Top-5 预测完全一致。
说明 NPU 上的推理精度与 CPU 基本一致,昇腾 NPU 可以可靠地用于该模型的部署。

├── inference.py # 推理脚本(支持 CPU/NPU)
├── compare_cpu_npu.py # CPU vs NPU 精度对比脚本
├── requirements.txt # 依赖列表
├── readme.md # 本文件
└── screenshot.png # 模拟终端输出截图