timm/vit_large_patch16_224.augreg_in21k_ft_in1k on Ascend NPU

1. 简介

将 timm/vit_large_patch16_224.augreg_in21k_ft_in1k（ViT-Large/16，ImageNet-21k 预训练 + ImageNet-1k 微调）适配为可在单卡华为昇腾 NPU（Ascend910B）上运行的提交工程。

pip install -r requirements.txt
python inference.py

推理结果（单张测试图片）：

Top-1 class: class_979
Top-1 prob: 0.6689
Top-5: class_979 (0.6689), class_970 (0.1847), class_972 (0.0179), class_888 (0.0143), class_671 (0.0105)

python eval_accuracy.py

python benchmark.py

注：以上为单卡单 batch=1 性能，实际部署可结合动态 batch 提升吞吐。

本工程执行 smoke consistency check（CPU vs NPU 一致性对比），非官方精度评测。 Top-1 和 Top-5 在 CPU 与 NPU 上完全一致。

详见 screenshots/self_verification.png 和 screenshots/self_verification.txt。

#NPU

1. 简介

将 timm/vit_large_patch16_224.augreg_in21k_ft_in1k（ViT-Large/16，ImageNet-21k 预训练 + ImageNet-1k 微调）适配为可在单卡华为昇腾 NPU（Ascend910B）上运行的提交工程。

模型来源：ModelScope timm/vit_large_patch16_224.augreg_in21k_ft_in1k

模型架构：Vision Transformer Large（ViT-L/16），304.3M 参数

输入尺寸：224x224 RGB

输出类别数：1000（ImageNet-1k）

权重格式：safetensors

项目

值

NPU 型号

Ascend910B

PyTorch

2.x + torch_npu

timm