g
gyccc/timm-edgenext_base.usi_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/edgenext_base.usi_in1k on Ascend NPU

1. 简介

本项目将 timm/edgenext_base.usi_in1k 图片分类模型适配到单卡昇腾 NPU(Ascend910)上运行。

  • 模型来源: ModelScope (timm)
  • 模型类型: 图像分类 (Image Classification)
  • 输入尺寸: 1 x 3 x 256 x 256
  • 输出维度: 1000 类 (ImageNet-1k)
  • 适配方式: timm.create_model(pretrained=False) + ModelScope snapshot_download 本地权重加载

2. 验证环境

项目版本/信息
NPUAscend910 (2 x Ascend910)
npu-smi25.5.2
torch2.9.0+cpu
torch_npu2.9.0.post1
timm1.0.27
modelscope1.35.3
transformers4.57.6
safetensors0.7.0

3. 推理运行

python inference.py

NPU 推理结果 (单张测试图):

项目数值
Input shape[1, 3, 256, 256]
Output shape[1, 1000]
Top-1class_644 (0.011867)
Top-5class_644, class_600, class_111, class_549, class_21

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.009187
mean_abs_error0.002032
relative_error0.3439%
cosine_similarity0.999994
threshold1.0%
结果PASS
  • CPU Top-1: class_644
  • NPU Top-1: class_644
  • CPU Top-5: class_644, class_600, class_111, class_549, class_21
  • NPU Top-5: class_644, class_600, class_111, class_549, class_21
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

python benchmark.py
指标数值
runs10
avg_latency_ms8.049
min_latency_ms8.005
max_latency_ms8.108
p50_latency_ms8.044
p90_latency_ms8.083
p95_latency_ms8.083
images_per_sec124.23

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png 和 screenshots/self_verification.txt。

8. 日志文件

日志说明
logs/env_check.logNPU 环境信息
logs/inference.logNPU 推理结果
logs/accuracy.logCPU-NPU 精度一致性
logs/benchmark.logNPU 性能基准

9. 注意事项

  1. 严禁 HuggingFace 直连下载:本项目使用 ModelScope snapshot_download 作为唯一下载方式。
  2. 权重不提交:仓库中不包含 .safetensors、.bin、.pth、.pt、.ckpt、.onnx 等权重文件,运行时自动从 ModelScope 下载。
  3. pretrained=False:模型结构通过 timm.create_model(..., pretrained=False) 创建,再加载本地下载的权重。
  4. 占位图:因网络环境限制,assets/test.jpg 为生成的占位图,不影响推理验证流程。

10. 标签 #NPU