timm/vit_tiny_patch16_224.augreg_in21k_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/vit_tiny_patch16_224.augreg_in21k_ft_in1k 适配到昇腾 NPU（Ascend910）。使用 ModelScope snapshot_download 下载权重，通过 timm.create_model(..., pretrained=False) 创建模型并加载本地权重，实现了推理验证、CPU-NPU 精度一致性检查和性能基准测试。

2. 验证环境

项目	版本/型号
NPU	Ascend910
CANN	8.5.1
torch	2.x
torch_npu	适配 CANN 8.5.1

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

Top-1: class_623 (0.0246)
Top-2: class_413 (0.0213)
Top-3: class_763 (0.0208)
Top-4: class_708 (0.0151)
Top-5: class_596 (0.0146)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.012974
mean_abs_error	0.003103
relative_error	0.2706%
cosine_similarity	0.999998
threshold	1.0%
结果	PASS

CPU Top-1: class_623
NPU Top-1: class_623
CPU Top-5: class_623, class_413, class_763, class_708, class_596
NPU Top-5: class_623, class_413, class_763, class_708, class_596
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
avg latency	5.376 ms
min latency	5.339 ms
max latency	5.442 ms
p50 latency	5.370 ms
p90 latency	5.442 ms
p95 latency	5.442 ms
Throughput	186.02 images/sec

日志保存在 logs/benchmark.log。

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

logs/env_check.log — 环境检查
logs/inference.log — 推理结果
logs/accuracy.log — 精度一致性
logs/benchmark.log — 性能基准

9. 注意事项

权重通过 ModelScope 下载，禁止 HuggingFace 自动下载。
timm.create_model 必须使用 pretrained=False，再加载本地权重。
推理与性能测试均在 npu:0 上执行。

10. 标签

#NPU #Ascend #Ascend910 #timm #ViT #image-classification

1. 简介

项目

版本/型号

NPU

Ascend910

CANN

8.5.1

torch

2.x

torch_npu

适配 CANN 8.5.1

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.012974
mean_abs_error	0.003103
relative_error	0.2706%
cosine_similarity	0.999998
threshold	1.0%
结果	PASS

CPU Top-1: class_623

NPU Top-1: class_623

CPU Top-5: class_623, class_413, class_763, class_708, class_596

NPU Top-5: class_623, class_413, class_763, class_708, class_596

Top-1 match: True

Top-5 match: True

指标

数值

avg latency

5.376 ms

min latency

5.339 ms

max latency

5.442 ms

p50 latency

5.370 ms

p90 latency

5.442 ms

p95 latency

5.442 ms

Throughput

186.02 images/sec