g
gyccc/timm-repvgg_b1.rvgg_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/repvgg_b1.rvgg_in1k on Ascend NPU

1. 简介

本项目将 timm/repvgg_b1.rvgg_in1k 图片分类模型适配到华为昇腾 NPU(Ascend910)上运行。

  • 使用 ModelScope snapshot_download 下载模型权重
  • 使用 timm.create_model(pretrained=False) 创建模型结构并加载本地权重
  • 支持 CPU 与 NPU 推理,并包含精度一致性校验和性能基准测试

2. 验证环境

项目版本/型号
NPUAscend910
npu-smi25.5.2
PyTorch2.x
torch_npu适配 Ascend910
timmlatest

3. 推理运行

pip install -r requirements.txt
python inference.py

推理输出示例:

Model: timm/repvgg_b1.rvgg_in1k
Input shape: [1, 3, 224, 224]
Output shape: [1, 1000]

Top-5 predictions:
  1. class_540: 0.9968
  2. class_718: 0.0018
  3. class_517: 0.0003
  4. class_913: 0.0002
  5. class_449: 0.0002

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.005261
mean_abs_error0.001245
relative_error0.0610%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

python benchmark.py
指标数值
Avg latency7.97 ms
Min latency7.76 ms
Max latency8.25 ms
P507.88 ms
P908.25 ms
Throughput125.53 images/sec

6. 精度评测

注:以下为单张测试图的 smoke consistency 检查,非官方 ImageNet 精度评测。

指标数值
Logits max diff0.005261
Probs max diff0.000006
Top-1 matchTrue
Top-5 matchTrue

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

  • logs/env_check.log — NPU 环境信息
  • logs/inference.log — 推理结果
  • logs/accuracy.log — 精度对比
  • logs/benchmark.log — 性能基准

9. 注意事项

  1. 权重通过 ModelScope 下载,不提交到仓库(已加入 .gitignore)
  2. 严禁使用 timm.create_model(..., pretrained=True) 进行 HuggingFace 直连下载
  3. 首次运行会自动通过 ModelScope 下载约 219MB 权重到本地缓存

10. 标签

#NPU #Ascend #timm #image-classification