g
gyccc/timm-efficientnet_b5.sw_in12k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/efficientnet_b5.sw_in12k_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/efficientnet_b5.sw_in12k_ft_in1k 图片分类模型适配到单卡昇腾 NPU(Ascend910)上运行。

模型使用 ModelScope snapshot_download 下载权重,通过 timm.create_model(pretrained=False) 创建模型结构并加载本地权重,不依赖 HuggingFace 直连下载,无 fallback。

2. 验证环境

项目版本/型号
NPUAscend910
npu-smi25.5.2
PyTorchtorch + torch_npu
timmlatest

环境详情见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 timm.data.resolve_model_data_config 自动解析输入尺寸与预处理参数,在 npu:0 上执行真实推理。

推理结果摘要:

  • 输入尺寸: [1, 3, 448, 448]
  • 输出尺寸: [1, 1000]
  • Top-1: class_600 (0.005953)

完整结果见 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.002437
mean_abs_error0.001015
relative_error0.0317%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

python benchmark.py
指标数值
迭代次数10
平均延迟18.93 ms
最小延迟18.59 ms
最大延迟19.32 ms
P90 延迟19.29 ms
P95 延迟19.30 ms
吞吐量52.81 images/sec

完整结果见 logs/benchmark.log。

6. 精度评测

本项目在单张测试图片上完成了 CPU-NPU smoke 一致性验证,确认 NPU 推理结果与 CPU 基准在 Top-1/Top-5 上完全匹配,logit 差异在可接受范围内。

注意: 本验证为 smoke consistency check,非官方 ImageNet 完整数据集精度评测。

7. 自验证截图

自验证截图与文本摘要已生成:

  • screenshots/self_verification.txt
  • screenshots/self_verification.png

8. 日志文件

文件说明
logs/env_check.logNPU 环境信息
logs/inference.log推理结果
logs/accuracy.logCPU/NPU 精度对比
logs/benchmark.log性能基准测试
logs/paths.txt模型下载路径记录

9. 注意事项

  1. 本工程不包含模型权重文件(.bin/.safetensors/.pth 等),首次运行时会通过 ModelScope 自动下载到本地缓存目录。
  2. 权重加载严格使用 pretrained=False,避免 HuggingFace 自动下载。
  3. 测试图片为网络下载或占位图,推理结果仅用于验证模型可运行性。
  4. 如运行过程中出现显存不足、运行超时或 exit code 137,说明当前环境无法承载该模型,应停止并生成失败说明。

10. 标签

#NPU