g
gyccc/timm-convnext_tiny.fb_in22k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/convnext_tiny.fb_in22k_ft_in1k on Ascend NPU

1. 简介

将 timm/convnext_tiny.fb_in22k_ft_in1k(ConvNeXt-Tiny,ImageNet-22k 预训练后微调至 ImageNet-1K)适配为可在单卡昇腾 NPU(Ascend910B)上运行的提交工程。

  • 模型类型:图像分类(ConvNeXt)
  • 参数量:28.6M
  • 输入:1x3x224x224
  • 输出:1x1000(ImageNet-1K 类别)
  • 权重来源:ModelScope snapshot_download + timm.create_model(pretrained=False)

2. 验证环境

  • 硬件:Ascend910B(HBM 64GB)
  • OS:Linux 5.10.0 (aarch64)
  • Python:3.x
  • PyTorch + torch_npu
  • npu-smi:NPU 0 状态 OK
  • Device:Ascend910_9362

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本通过 ModelScope snapshot_download 下载模型,使用 timm.create_model(pretrained=False) 创建结构并加载本地 safetensors 权重,在 npu:0 上执行推理,输出 Top-5 预测结果。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.017811
mean_abs_error0.003295
relative_error0.4815%
cosine_similarity0.999991
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标值
平均延迟6.73 ms
最小延迟6.69 ms
最大延迟6.87 ms
P506.72 ms
P906.87 ms
P956.87 ms
吞吐量148.58 images/sec

测试条件:batch=1, 224x224, warmup=2, runs=10

6. 精度评测

详见 logs/accuracy.log,为 smoke consistency 检查,非官方精度评测。

7. 自验证截图

见 screenshots/self_verification.png

8. 日志文件

  • logs/inference.log — 推理结果
  • logs/accuracy.log — 精度对比
  • logs/benchmark.log — 性能测试
  • logs/env_check.log — 环境检查

9. 注意事项

  • 使用 ModelScope snapshot_download 作为主下载方式,不使用 HuggingFace 直连
  • timm.create_model(pretrained=False),权重通过本地 safetensors 加载
  • 不 fallback,不提交权重文件
  • 精度验证为 smoke consistency,非官方 ImageNet 评测

10. 标签

#NPU