g
gyccc/timm-resnext50_32x4d.a1_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/resnext50_32x4d.a1_in1k on Ascend NPU

1. 简介

本项目将 timm/resnext50_32x4d.a1_in1k 图片分类模型适配到单卡昇腾 NPU(Ascend910),支持真实 NPU 推理、CPU-NPU 精度一致性对比和性能基准测试。

  • 模型来源:ModelScope
  • 模型类型:timm 图片分类
  • 输入尺寸:1x3x224x224
  • 输出维度:1000 类 logits
  • 加载方式:timm.create_model(pretrained=False) + ModelScope 本地权重加载

2. 验证环境

  • NPU: Ascend910
  • npu-smi: 25.5.2
  • PyTorch + torch_npu

环境详情见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_637 (0.2760)
  • Top-2: class_707 (0.2614)
  • Top-3: class_480 (0.0792)
  • Top-4: class_369 (0.0357)
  • Top-5: class_571 (0.0279)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

推理结果(单张测试图片):

  • Top-1 class: class_701
  • Top-1 prob: 0.0146
  • Top-5: class_701 (0.0146), class_405 (0.0121), class_21 (0.0113), class_783 (0.0081), class_644 (0.0080) 对单张测试图片进行 CPU 与 NPU 一致性验证:
指标数值
max_abs_error0.014154
mean_abs_error0.002434
relative_error0.0248%
cosine_similarity1.000000
threshold1.0%
结果PASS

5. 性能参考

python benchmark.py
指标数值
Avg latency5.90 ms
Min latency5.79 ms
Max latency6.03 ms
P50 latency5.89 ms
P90 latency5.95 ms
P95 latency5.99 ms
Throughput169.61 images/sec

6. 精度评测

本项目仅提供 Smoke 一致性验证(单张随机图片 CPU vs NPU),非官方 ImageNet 验证集精度。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

  • logs/env_check.log
  • logs/inference.log
  • logs/accuracy.log
  • logs/benchmark.log
  • logs/paths.txt

9. 注意事项

  1. 权重通过 ModelScope snapshot_download 下载到本地缓存,运行时动态加载。
  2. 请勿将 .bin / .safetensors / .pth / .pt / .ckpt / .onnx 提交到仓库。
  3. 推理前请确保 NPU 驱动和 torch_npu 已正确安装。

10. 标签

#NPU #Ascend #timm #image-classification