g
gyccc/timm-efficientnet_b0.ra_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/efficientnet_b0.ra_in1k on Ascend NPU

1. 简介

本工程将 timm/efficientnet_b0.ra_in1k 图片分类模型适配为可在单卡昇腾 NPU(Ascend910B)上运行的提交工程。

  • 模型来源:ModelScope(snapshot_download)
  • 模型结构:timm.create_model("efficientnet_b0.ra_in1k", pretrained=False)
  • 权重加载:本地 safetensors 权重,禁止 HuggingFace 自动下载
  • 适配方式:PyTorch + torch_npu,单卡推理

2. 验证环境

项目值
硬件单卡 Ascend910B
框架PyTorch + torch_npu
模型timm/efficientnet_b0.ra_in1k
参数量~5.3M
输入尺寸[1, 3, 224, 224]
输出尺寸[1, 1000]

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果示例:

  • Top-1: class_970 (0.4330)
  • Top-2: class_795 (0.1762)
  • Top-3: class_22 (0.0581)
  • Top-4: class_80 (0.0372)
  • Top-5: class_979 (0.0155)

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.009274
mean_abs_error0.001714
relative_error0.1903%
cosine_similarity0.999998
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标值
平均推理时间7.06 ms
最小6.92 ms
最大7.36 ms
P506.97 ms
P907.34 ms
P957.35 ms
吞吐量141.74 images/sec

6. 精度评测

本工程执行的是 smoke consistency check(同输入、同精度下 CPU 与 NPU 结果一致性),非官方精度评测。

7. 自验证截图

见 screenshots/self_verification.png

8. 日志文件

文件说明
logs/inference.log推理结果日志
logs/accuracy.log精度验证日志
logs/benchmark.log性能测试日志
logs/env_check.log环境检查日志

9. 注意事项

  • 本工程使用 pretrained=False + 本地权重加载,不依赖 HuggingFace 在线下载
  • 仅验证单卡 NPU 推理能力,不涉及分布式训练
  • 权重文件(.safetensors、.bin 等)不包含在提交工程中
  • 精度验证为 smoke check,非官方 benchmark

10. 标签

#NPU