timm/swin_large_patch4_window7_224.ms_in22k_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/swin_large_patch4_window7_224.ms_in22k_ft_in1k 图片分类模型适配到单卡昇腾 NPU（Ascend910）。

模型类型：timm 标准图片分类模型
输入尺寸：224x224
输出类别数：1000

2. 验证环境

NPU: Ascend910_9362
npu-smi: 25.5.2
Python: 3.11
PyTorch + torch_npu

详细环境信息见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 modelscope.snapshot_download 下载权重，timm.create_model(pretrained=False) 创建模型结构并加载本地权重，在 npu:0 上执行真实推理。

Top-5 预测结果示例：

class_499: 0.003955
class_680: 0.002788
class_473: 0.002762
class_644: 0.002744
class_551: 0.002708

4. Smoke 验证

python eval_accuracy.py

CPU 与 NPU 推理结果对比：

Top-1 匹配：True（class_499）
Top-5 匹配：True
Max logit diff: 7.20e-03
Mean logit diff: 1.55e-03

说明：此为 smoke consistency 检查，非官方 ImageNet 精度评测。

5. 性能参考

python benchmark.py

指标	数值
Avg	17.54 ms
Min	17.00 ms
Max	18.03 ms
P50	17.72 ms
P90	17.90 ms
P95	17.96 ms
Throughput	57.00 images/sec

6. 精度评测

eval_accuracy.py 对同一输入分别在 CPU 和 NPU 上推理，对比 logits 分布与 Top-K 一致性。结果见 logs/accuracy.log。

7. 自验证截图

见 screenshots/self_verification.png 与 screenshots/self_verification.txt。

8. 日志文件

logs/env_check.log — 环境检查
logs/inference.log — 推理日志
logs/accuracy.log — 精度对比日志
logs/benchmark.log — 性能基准日志
logs/stage0.log — 模型可用性验证日志

9. 注意事项

权重通过 ModelScope snapshot_download 自动下载到本地缓存，首次运行需要联网。
严禁使用 pretrained=True 触发 HuggingFace 直连下载。
本仓库不提交模型权重文件。

10. 标签

#NPU