g
gyccc/timm-xcit_tiny_12_p16_224.fb_dist_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/xcit_tiny_12_p16_224.fb_dist_in1k on Ascend NPU

1. 简介

本工程将 ModelScope timm/xcit_tiny_12_p16_224.fb_dist_in1k 图片分类模型适配到单卡昇腾 NPU (Ascend910)。

  • 模型来源:ModelScope timm/xcit_tiny_12_p16_224.fb_dist_in1k
  • 模型类型:图片分类 (Image Classification)
  • 输入尺寸:224x224
  • 输出类别:1000 (ImageNet-1k)
  • 加载方式:timm.create_model(pretrained=False) + ModelScope snapshot_download 本地权重
  • 推理设备:Ascend910 NPU

2. 验证环境

  • NPU: Ascend910 (npu-smi 25.5.2)
  • PyTorch + torch_npu
  • Python 3.11
  • timm, modelscope, safetensors

环境详情见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_605 (0.2421)
  • Top-2: class_681 (0.2124)
  • Top-3: class_487 (0.0983)
  • Top-4: class_673 (0.0828)
  • Top-5: class_620 (0.0559)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.032056
mean_abs_error0.004276
relative_error0.5414%
cosine_similarity0.999989
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

运行 python benchmark.py(预热 2 轮 + 正式 10 轮):

  • Avg latency: 12.01 ms
  • Min latency: 11.28 ms
  • Max latency: 12.37 ms
  • Throughput: 83.24 images/sec

6. 精度评测

当前仅提供 smoke consistency 验证。如需完整 ImageNet-1k 精度评测,需准备官方验证集并运行完整 eval。

7. 自验证截图

自验证摘要见 screenshots/self_verification.txt 和 screenshots/self_verification.png。

8. 日志文件

  • logs/env_check.log — 环境检查
  • logs/inference.log — 推理结果
  • logs/accuracy.log — CPU-NPU 一致性
  • logs/benchmark.log — 性能基准
  • logs/paths.txt — 模型路径记录

9. 注意事项

  • 权重通过 ModelScope snapshot_download 下载,不依赖 HuggingFace 直连。
  • 工程中不包含权重文件(.bin/.safetensors/.pth/.pt/.ckpt/.onnx 已加入 .gitignore)。
  • 首次运行会自动下载权重到本地缓存目录。

10. 标签

#NPU