g
gyccc/timm-efficientnet_b4.ra2_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/efficientnet_b4.ra2_in1k on Ascend NPU

1. 简介

将 timm EfficientNet-B4 (ra2_in1k 变体) 图片分类模型适配到华为昇腾 NPU (Ascend910)。

  • 模型来源:timm/efficientnet_b4.ra2_in1k(ModelScope)
  • 模型参数量:约 19M
  • 输入尺寸:224x224 RGB
  • 输出类别数:1000(ImageNet)
  • 下载方式:ModelScope snapshot_download + timm.create_model(pretrained=False) 本地权重加载

2. 验证环境

项目值
设备Ascend910
PyTorchtorch + torch_npu
模型加载pretrained=False + 本地 safetensors
验证日期2026-05-12

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_403 (0.2122)
  • Top-2: class_554 (0.0614)
  • Top-3: class_540 (0.0472)
  • Top-4: class_628 (0.0424)
  • Top-5: class_405 (0.0392)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.004847
mean_abs_error0.001143
relative_error0.1104%
cosine_similarity0.999999
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标值
平均延迟19.29 ms
最小延迟15.05 ms
最大延迟42.08 ms
P5015.55 ms
P9025.16 ms
P9533.62 ms
吞吐量51.85 images/sec

6. 精度评测

本次为 Smoke 一致性验证,非官方精度评测。Top-1/Top-5 在 CPU 与 NPU 间完全匹配。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件说明
logs/env_check.logNPU 环境检查
logs/inference.log推理结果
logs/accuracy.log精度验证
logs/benchmark.log性能基准

9. 注意事项

  • 使用 ModelScope snapshot_download 下载模型权重,不依赖 HuggingFace 直连
  • timm.create_model(pretrained=False) 创建结构,手动加载本地权重
  • 未提交任何权重文件(.safetensors / .bin 等已在 .gitignore 中排除)
  • Smoke 验证仅验证 CPU-NPU 一致性,不代表最终 ImageNet 精度

10. 标签

#NPU #Ascend910 #image-classification #timm #efficientnet