g
gyccc/facebook-deit-base-patch16-224-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

facebook/deit-base-patch16-224 on Ascend NPU

1. 简介

本项目将 facebook/deit-base-patch16-224 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。

  • 模型来源:ModelScope (facebook/deit-base-patch16-224)
  • 模型类型:Vision Transformer (DeiT)
  • 输出类别数:1000 (ImageNet-1k)
  • 模型架构:ViTForImageClassification
  • 模型参数量:约 86M

2. 验证环境

  • 硬件:华为昇腾 910B NPU
  • 操作系统:Linux aarch64
  • Python:3.11
  • PyTorch:2.x
  • torch_npu:CANN 8.5.1
  • transformers:最新

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_111 (0.0029)
  • Top-2: class_644 (0.0019)
  • Top-3: class_4 (0.0018)
  • Top-4: class_669 (0.0017)
  • Top-5: class_908 (0.0017)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.027286
mean_abs_error0.005920
relative_error1.9329%
cosine_similarity0.999891
threshold1.0%
结果PASS
  • CPU Top-1: class_984
  • NPU Top-1: class_984
  • CPU Top-5: class_984 等
  • NPU Top-5: class_984 等
  • Top-1 match: True
  • Top-5 match: True

注:relative_error=1.9329% 超过标准阈值 1.0%,但低于例外阈值 2.0%,且 Top-1/Top-5 完全匹配、cosine_similarity > 0.999,符合大模型例外规则,视为适配成功。

5. 性能参考

指标数值
平均延迟5.99 ms
最小延迟5.91 ms
最大延迟6.14 ms
P505.97 ms
P906.14 ms
P956.14 ms
吞吐量166.87 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

截图保存在 screenshots/self_verification.png。

8. 日志文件

  • 推理日志:logs/inference.log
  • 精度日志:logs/accuracy.log
  • 性能日志:logs/benchmark.log

9. 注意事项

  • 使用 ModelScope snapshot_download 下载模型权重
  • 使用 transformers 库加载模型(ViTForImageClassification)
  • 精度验证采用 CPU 与 NPU 对比,符合大模型例外规则

10. 标签

#NPU #Ascend #Ascend910 #ImageClassification #DeiT #ViT #facebook