g
gyccc/timm-resnext101_32x4d.fb_swsl_ig1b_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/resnext101_32x4d.fb_swsl_ig1b_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/resnext101_32x4d.fb_swsl_ig1b_ft_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。

  • 模型来源: ModelScope (timm)
  • 模型类型: 图片分类 (Image Classification)
  • 输入尺寸: 224x224
  • 输出类别: 1000 (ImageNet-1k)
  • 适配方式: ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重

2. 验证环境

组件版本/信息
NPUAscend910 (Ascend910_9362)
npu-smi25.5.2
PyTorchwith torch_npu
timmlatest

NPU 状态: npu_available=True

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 assets/test.jpg 进行单图推理,输出 Top-5 预测结果。

推理输出示例:

=== NPU 推理结果 ===
模型: timm/resnext101_32x4d.fb_swsl_ig1b_ft_in1k
输出 shape: torch.Size([1, 1000])
设备: npu:0
Top-5 预测:
  1. class_978: 0.893230
  2. class_977: 0.051284
  3. class_975: 0.013747
  4. class_979: 0.007612
  5. class_976: 0.007241

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.010977
mean_abs_error0.001877
relative_error0.1644%
cosine_similarity0.999999
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

基于 benchmark.py 在单卡 NPU 上的测试结果(预热 2 次 + 正式 10 次):

指标数值
平均延迟9.70 ms
最小延迟9.55 ms
最大延迟9.83 ms
P50 延迟9.71 ms
P90 延迟9.78 ms
P95 延迟9.78 ms
吞吐量103.13 images/sec

6. 精度评测

eval_accuracy.py 对同一张测试图分别进行 CPU 和 NPU 推理,对比结果如下:

指标结果
Logits 最大差异0.01097679
Prob 最大差异0.00075084
CPU Top-1class_978
NPU Top-1class_978
CPU Top-5[978, 977, 975, 979, 976]
NPU Top-5[978, 977, 975, 979, 976]
Top-1 一致True
Top-5 一致True

注意: 本测试为 smoke consistency 验证,非官方 ImageNet 精度评测。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

日志说明
logs/stage0.logStage 0 模型预判与可用性检查
logs/env_check.log环境检查
logs/inference.logNPU 推理结果
logs/accuracy.logCPU-NPU 精度一致性
logs/benchmark.log性能基准测试

9. 注意事项

  1. 权重通过 ModelScope snapshot_download 下载,不依赖 HuggingFace 直连。
  2. timm.create_model(pretrained=False) 创建模型结构后,加载本地权重文件。
  3. 本项目不包含模型权重文件,运行时会自动从 ModelScope 下载。
  4. 请勿将 .bin/.safetensors/.pth/.pt/.ckpt/.onnx 文件提交到仓库。

10. 标签

#NPU #Ascend #ImageClassification #timm #ResNeXt