g
gyccc/timm-tf_efficientnet_b3-ap_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/tf_efficientnet_b3.ap_in1k 在昇腾 NPU 上的部署

1. 简介

本项目将 timm/tf_efficientnet_b3.ap_in1k 图像分类模型适配到华为昇腾 NPU(Ascend910)。通过 ModelScope snapshot_download 下载权重,使用 timm.create_model(pretrained=False) 创建模型结构并加载本地权重,包含推理验证、CPU-NPU 精度一致性检查以及性能基准测试。

2. 验证环境

  • 硬件:Ascend910 NPU
  • 框架:PyTorch + torch_npu
  • 模型:timm/tf_efficientnet_b3.ap_in1k(EfficientNet-B3,ImageNet-1k)

3. 推理运行

python inference.py

输出 Top-5 预测类别及概率,日志写入 logs/inference.log。

=== Inference Result ===
Model: timm/tf_efficientnet_b3.ap_in1k
Device: npu:0
Output shape: torch.Size([1, 1000])

Top-1: class_405 (prob=0.0057)
Top-2: class_600 (prob=0.0049)
Top-3: class_701 (prob=0.0048)
Top-4: class_623 (prob=0.0045)
Top-5: class_895 (prob=0.0044)

Full logits (first 10): [-0.45889613032341003, 0.050226159393787384, 0.22011253237724304, 0.11555498093366623, 0.4635002613067627, 0.12647953629493713, -0.08388809859752655, -0.07328705489635468, -0.3965292274951935, 0.3011126220226288]

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.001079
mean_abs_error0.000197
relative_error0.0467%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1: class_405
  • NPU Top-1: class_405
  • CPU Top-5: class_405, class_600, class_701, class_623, class_895
  • NPU Top-5: class_405, class_600, class_701, class_623, class_895
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
avg_latency11.85 ms
min_latency11.50 ms
max_latency12.11 ms
p50_latency11.87 ms
p90_latency12.11 ms
p95_latency12.11 ms
throughput84.37 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log — 推理结果
  • logs/accuracy.log — 精度一致性检查
  • logs/benchmark.log — 性能基准测试
  • logs/env_check.log — 环境检查

9. 注意事项

  • 使用 ModelScope 下载权重,不使用 HuggingFace 直连
  • 不提交任何权重文件(*.safetensors, *.bin, *.pth, *.pt, *.ckpt, *.onnx)
  • 单图 smoke 验证,非完整 ImageNet 评测

10. 标签

#NPU