g
gyccc/timm-vgg13-tv_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/vgg13.tv_in1k on Ascend NPU

1. 简介

本项目将 timm/vgg13.tv_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 创建模型结构并加载本地权重,不依赖 HuggingFace 直连下载。

2. 验证环境

项目信息
芯片Ascend910
OSLinux 5.10.0-182.0.0.95.r2220_156.hce2.aarch64
PyTorch2.x
torch_npu支持
npu-smiAscend910, Health OK, 65536MB HBM

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理输出:

项目值
模型timm/vgg13.tv_in1k
设备npu:0
输入 shape[1, 3, 224, 224]
输出 shape[1, 1000]

Top-5 预测:

  1. class_813 (confidence: 0.0176)
  2. class_623 (confidence: 0.0164)
  3. class_846 (confidence: 0.0124)
  4. class_499 (confidence: 0.0123)
  5. class_534 (confidence: 0.0109)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.000715
mean_abs_error0.000144
relative_error0.0164%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1: class_813
  • NPU Top-1: class_813
  • CPU Top-5: class_813, class_623, class_846, class_499, class_534
  • NPU Top-5: class_813, class_623, class_846, class_499, class_534
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
平均延迟2.08 ms
最小延迟2.06 ms
最大延迟2.10 ms
P502.07 ms
P902.09 ms
P952.09 ms
吞吐量481.72 images/sec

测试条件:batch=1, 单次推理, Warmup 2 次, 正式 10 次。

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件说明
logs/inference.log推理结果日志
logs/accuracy.logCPU-NPU 精度一致性检查日志
logs/benchmark.log性能基准测试日志
logs/env_check.logNPU 环境检查日志

9. 注意事项

  • 本项目使用 ModelScope snapshot_download 下载权重,不使用 HuggingFace 直连
  • 模型权重未提交到 Git 仓库(已在 .gitignore 中排除)
  • 精度验证为单图 smoke test,非完整 ImageNet 评测
  • CPU-NPU 精度相对误差 0.0164%,远低于 1.0% 阈值

10. 标签 #NPU