timm/vit_tiny_patch16_224.augreg_in21k on Ascend NPU

1. 简介

将 timm 库中的 ViT-Tiny（patch16_224，ImageNet-21K 预训练）模型适配为可在单卡昇腾 NPU（Ascend910）上运行的推理工程。该模型为 Vision Transformer Tiny 架构，输出 21843 类（ImageNet-21K fine-grained 分类）。

2. 验证环境

硬件：Ascend910 NPU（单卡）
设备：Ascend910_9362
框架：PyTorch + torch_npu
模型来源：ModelScope snapshot_download
权重格式：safetensors（37.2MB）

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 model_utils.py 加载模型：

timm.create_model("vit_tiny_patch16_224.augreg_in21k", pretrained=False) 创建模型结构
ModelScope snapshot_download 下载权重到本地
safetensors 格式加载权重到模型
输出 shape：[1, 21843]（21843 类 ImageNet-21K）

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.049053
mean_abs_error	0.009415
relative_error	0.0552%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_9931
NPU Top-1: class_9931
CPU Top-5: class_9931, class_4407, class_9930, class_10436, class_21675
NPU Top-5: class_9931, class_4407, class_9930, class_10436, class_21675
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
平均延迟	5.34 ms
最小延迟	5.31 ms
最大延迟	5.39 ms
P50 延迟	5.34 ms
P90 延迟	5.38 ms
P95 延迟	5.38 ms
吞吐量	187.26 images/sec
测试次数	10

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

logs/inference.log — 推理结果
logs/accuracy.log — 精度验证
logs/benchmark.log — 性能测试
logs/env_check.log — 环境检查

9. 注意事项

本模型输出 21843 类（ImageNet-21K fine-grained），非标准 ImageNet-1K 的 1000 类
使用 timm.create_model(pretrained=False) + 本地权重加载，不使用 HuggingFace 直连下载
所有权重文件（*.safetensors, *.bin）未提交到仓库

10. 标签

#NPU #Ascend #ViT-Tiny #ImageNet-21K #timm

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 model_utils.py 加载模型：

timm.create_model("vit_tiny_patch16_224.augreg_in21k", pretrained=False) 创建模型结构

ModelScope snapshot_download 下载权重到本地

safetensors 格式加载权重到模型

输出 shape：[1, 21843]（21843 类 ImageNet-21K）

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.049053
mean_abs_error	0.009415
relative_error	0.0552%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_9931

NPU Top-1: class_9931

CPU Top-5: class_9931, class_4407, class_9930, class_10436, class_21675

NPU Top-5: class_9931, class_4407, class_9930, class_10436, class_21675

Top-1 match: True

Top-5 match: True

指标

数值

平均延迟

5.34 ms

最小延迟

5.31 ms

最大延迟

5.39 ms

P50 延迟

5.34 ms

P90 延迟

5.38 ms

P95 延迟

5.38 ms

吞吐量

187.26 images/sec

测试次数