g
gyccc/timm-tf_efficientnetv2_l.in21k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/tf_efficientnetv2_l.in21k on Ascend NPU

1. 简介

将 timm 的 EfficientNetV2-L (ImageNet-21k 预训练) 模型适配到单卡昇腾 NPU (Ascend910)。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 创建结构并加载本地权重。

  • 模型: tf_efficientnetv2_l.in21k
  • 参数量: ~145M
  • 输出类别数: 21843 (ImageNet-21k)
  • 权重文件: model.safetensors (556 MB)

2. 验证环境

  • 硬件: Huawei Ascend 910 (64GB HBM)
  • OS: Linux 5.10.0-182.0.0.95.r2220_156.hce2.aarch64
  • Python: 3.x
  • PyTorch: 2.x + torch_npu
  • timm: latest
  • ModelScope: latest
  • 设备: npu:0 (Ascend910_9362)

3. 推理运行

cd timm-tf_efficientnetv2_l.in21k-NPU
pip install -r requirements.txt
python inference.py

推理日志 logs/inference.log 示例:

Model: timm/tf_efficientnetv2_l.in21k
Output shape: torch.Size([1, 21843])
Device: npu:0
Missing keys: 0, Unexpected keys: 0

Top-5 Predictions:
  1. class_11871 (0.93%)
  2. class_6255 (0.62%)
  3. class_10987 (0.50%)
  4. class_8310 (0.40%)
  5. class_10323 (0.36%)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.003940
mean_abs_error0.000513
relative_error0.0432%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1: class_11871
  • NPU Top-1: class_11871
  • CPU Top-5: class_11871, class_6255, class_10987, class_8310, class_10323
  • NPU Top-5: class_11871, class_6255, class_10987, class_8310, class_10323
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
平均延迟30.41 ms
最小延迟29.64 ms
最大延迟31.90 ms
P50 延迟30.37 ms
P90 延迟30.96 ms
P95 延迟31.56 ms
吞吐量32.89 images/sec

测试条件: batch=1, 输入 224x224, 预热 3 次 + 正式 20 次, 单卡 Ascend 910。

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log — 推理日志
  • logs/accuracy.log — 精度验证日志
  • logs/benchmark.log — 性能基准日志

9. 注意事项

  • 该模型为 ImageNet-21k 预训练,输出 21843 个类别,无 id2label 映射,以 class_x 形式展示
  • 使用 ModelScope snapshot_download 作为唯一下载方式,不使用 HuggingFace 直连
  • 使用 timm.create_model(pretrained=False) + 本地 safetensors 权重加载
  • 权重文件未提交到仓库

10. 标签

#NPU #Ascend #Ascend910 #EfficientNetV2 #ImageNet21k #ImageClassification