timm/xcit_tiny_12_p16_224.fb_dist_in1k on Ascend NPU

1. 简介

本工程将 ModelScope timm/xcit_tiny_12_p16_224.fb_dist_in1k 图片分类模型适配到单卡昇腾 NPU (Ascend910)。

模型来源：ModelScope timm/xcit_tiny_12_p16_224.fb_dist_in1k
模型类型：图片分类 (Image Classification)
输入尺寸：224x224
输出类别：1000 (ImageNet-1k)
加载方式：timm.create_model(pretrained=False) + ModelScope snapshot_download 本地权重
推理设备：Ascend910 NPU

环境详情见 logs/env_check.log。

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

Top-1: class_605 (0.2421)
Top-2: class_681 (0.2124)
Top-3: class_487 (0.0983)
Top-4: class_673 (0.0828)
Top-5: class_620 (0.0559)

日志保存在 logs/inference.log。

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证：

运行 python benchmark.py（预热 2 轮 + 正式 10 轮）：

当前仅提供 smoke consistency 验证。如需完整 ImageNet-1k 精度评测，需准备官方验证集并运行完整 eval。

自验证摘要见 screenshots/self_verification.txt 和 screenshots/self_verification.png。

权重通过 ModelScope snapshot_download 下载，不依赖 HuggingFace 直连。
工程中不包含权重文件（.bin/.safetensors/.pth/.pt/.ckpt/.onnx 已加入 .gitignore）。
首次运行会自动下载权重到本地缓存目录。

#NPU

1. 简介

模型来源：ModelScope timm/xcit_tiny_12_p16_224.fb_dist_in1k

模型类型：图片分类 (Image Classification)

输入尺寸：224x224

输出类别：1000 (ImageNet-1k)

加载方式：timm.create_model(pretrained=False) + ModelScope snapshot_download 本地权重

推理设备：Ascend910 NPU

指标

数值

max_abs_error

0.032056

mean_abs_error

0.004276

relative_error

0.5414%

cosine_similarity

0.999989

threshold

1.0%

结果

PASS