g
gyccc/timm-tf_efficientnetv2_s.in21k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/tf_efficientnetv2_s.in21k_ft_in1k on Ascend NPU

#NPU

1. 简介

本项目将 timm/tf_efficientnetv2_s.in21k_ft_in1k 模型适配为可在单卡昇腾 NPU(Ascend910)上运行的推理工程。

  • 模型名称: EfficientNetV2-S (ImageNet-21k 预训练 + ImageNet-1k 微调)
  • 来源: ModelScope
  • 输入尺寸: 300x300 RGB
  • 类别数: 1000

2. 验证环境

  • NPU 设备: Ascend910_9362
  • torch: 支持版本
  • torch_npu: 已安装并可用
  • modelscope: 已安装

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_972 (0.6423)
  • Top-2: class_979 (0.1736)
  • Top-3: class_970 (0.0312)
  • Top-4: class_976 (0.0090)
  • Top-5: class_888 (0.0043)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.003197
mean_abs_error0.000653
relative_error0.0999%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

单卡 Ascend910 NPU 性能测试结果:

  • 平均延迟: 15.02 ms
  • 最小延迟: 14.49 ms
  • 最大延迟: 15.34 ms
  • 吞吐量: 66.56 images/sec

6. 精度评测

Top-5 预测结果(测试图):

  1. class_972: 64.23%
  2. class_979: 17.36%
  3. class_970: 3.12%
  4. class_976: 0.90%
  5. class_888: 0.43%

7. 自验证截图

见 screenshots/ 目录。

8. 日志文件

  • logs/env_check.log - 环境检查日志
  • logs/inference.log - 推理日志
  • logs/accuracy.log - 精度验证日志
  • logs/benchmark.log - 性能基准测试日志

9. 注意事项

  • 本项目不包含模型权重文件,权重通过 ModelScope snapshot_download 自动下载
  • 首次运行时会自动下载权重到本地缓存
  • 推理使用 timm.create_model(pretrained=False) + 本地权重加载方式
  • 不支持 HuggingFace 直连下载

10. 标签 #NPU

本项目适配华为昇腾 NPU 平台,使用 torch_npu 进行推理加速。