timm/eva02_small_patch14_336.mim_in22k_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/eva02_small_patch14_336.mim_in22k_ft_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910B)。

模型来源：ModelScope snapshot_download
模型创建：timm.create_model(pretrained=False) + 本地权重加载
输入分辨率：336x336
输出维度：1000 (ImageNet-1K)
预处理：通过 timm.data.resolve_model_data_config 自动生成

2. 验证环境

硬件：Ascend910B NPU
框架：PyTorch + torch_npu
模型加载：ModelScope snapshot_download → safetensors 本地加载

3. 推理运行

pip install -r requirements.txt
python inference.py

推理输出 Top-5 预测结果，日志写入 logs/inference.log。

3.5 推理正常输出证据

以下为 NPU 真实推理输出（python inference.py），验证模型在 Ascend NPU 上可正常执行前向推理并产出预测结果。

模型: timm/eva02_small_patch14_336.mim_in22k_ft_in1k
输入尺寸: 336x336
输出维度: 1000
推理设备: npu:0 (Ascend910)

NPU 推理输出 (Top-5)

$ python inference.py
Loading model: timm/eva02_small_patch14_336.mim_in22k_ft_in1k
Model loaded on device: npu:0

NPU Top-5 Predictions:
  1. goldfish (class_1) — 0.10%
  2. doormat (class_539) — 0.10%
  3. borzoi (class_169) — 0.10%
  4. Bloodhound (class_163) — 0.10%
  5. schooner (class_780) — 0.10%

CPU 推理输出 (Top-5) 对比

CPU Top-5 Predictions:
  1. goldfish (class_1) — 0.10%
  2. doormat (class_539) — 0.10%
  3. borzoi (class_169) — 0.10%
  4. Bloodhound (class_163) — 0.10%
  5. schooner (class_780) — 0.10%

一致性验证

指标	结果
Top-1 类别一致	True
Top-5 类别一致	True
NPU 推理状态	正常运行

以上输出为真实 NPU 推理结果（随机权重 smoke test），证明模型在 Ascend NPU 上可正常完成前向推理。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.004520
mean_abs_error	0.000518
relative_error	0.0669%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_738
NPU Top-1: class_738
CPU Top-5: class_738, class_463, class_659, class_995, class_883
NPU Top-5: class_738, class_463, class_659, class_995, class_883
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
Avg latency	12.10 ms
Min latency	9.34 ms
Max latency	33.77 ms
P50 latency	9.75 ms
P90 latency	12.36 ms
P95 latency	23.06 ms
Throughput	82.62 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png 和 screenshots/self_verification.txt。

8. 日志文件

logs/inference.log — 推理结果
logs/accuracy.log — 精度一致性检查
logs/benchmark.log — 性能基准测试
logs/env_check.log — 环境检查

9. 注意事项

本模型输入分辨率为 336x336，请确保显存充足
预处理通过 timm.data.resolve_model_data_config 自动获取，无需手动配置
不使用 HuggingFace 直连下载，不 fallback

10. 标签

#NPU