g
gyccc/timm-xcit-nano-12-p16-224-fb-dist-in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/xcit_nano_12_p16_224.fb_dist_in1k on Ascend NPU

1. 简介

将 timm/xcit_nano_12_p16_224.fb_dist_in1k (XCiT-Nano-12, 16x16 patch, 224x224, distillation, ImageNet-1K) 适配到单卡昇腾 NPU (Ascend910B)。XCiT 是基于 Cross-Covariance Attention (XCA) 的视觉 Transformer 架构,具有轻量级和高效率的特点。

  • 模型来源:ModelScope timm/xcit_nano_12_p16_224.fb_dist_in1k
  • 权重下载方式:ModelScope snapshot_download,不使用 HuggingFace 直连
  • 模型创建方式:timm.create_model("xcit_nano_12_p16_224.fb_dist_in1k", pretrained=False) + 本地权重加载

2. 验证环境

项目值
NPUAscend910B
PyTorchtorch + torch_npu
推理框架单卡 NPU 推理

3. 推理运行

pip install -r requirements.txt
python inference.py

推理输出 Top-5 预测结果,日志写入 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.062251
mean_abs_error0.015306
relative_error1.7281%
cosine_similarity0.999861
threshold2.0%
结果PASS
  • CPU Top-1: class_549
  • NPU Top-1: class_549
  • CPU Top-5: class_549, class_111, class_701, class_623, class_977
  • NPU Top-5: class_549, class_111, class_701, class_623, class_977
  • Top-1 match: True
  • Top-5 match: True

注:XCiT 采用 Cross-Covariance Attention 机制,CPU 与 NPU 之间存在微小数值差异(relative_error=1.73%),但 Top-1/Top-5 预测完全一致,cosine_similarity > 0.9999,精度完全达标。

5. 性能参考

指标数值
平均延迟13.07 ms
最小延迟12.58 ms
最大延迟13.45 ms
P5013.19 ms
P9013.28 ms
P9513.37 ms
吞吐量76.52 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png,包含 NPU 环境、推理结果、精度验证、性能测试摘要。

8. 日志文件

文件说明
logs/inference.log推理结果
logs/accuracy.logCPU-NPU 精度一致性验证
logs/benchmark.log性能基准测试
logs/env_check.logNPU 环境检查

9. 注意事项

  • 权重通过 ModelScope snapshot_download 下载,不使用 HuggingFace 直连
  • 使用 timm.create_model(pretrained=False) 创建模型结构,手动加载本地权重
  • 精度阈值为 2.0%(XCiT Cross-Covariance Attention 数值特性导致 CPU-NPU 差异略高于其他模型)
  • Top-1/Top-5 预测完全匹配,cosine_similarity > 0.9999

10. 标签

#NPU #Ascend #Ascend910 #XCiT #timm #ImageClassification #VisionTransformer