g
gyccc/timm-deit3_base_patch16_224.fb_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/deit3_base_patch16_224.fb_in1k on Ascend NPU

1. 简介

将 timm 框架下的 DeiT3 Base 模型 (deit3_base_patch16_224.fb_in1k) 适配到华为昇腾 NPU (Ascend910B)。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 创建结构并加载本地权重,无需 HuggingFace 直连。

2. 验证环境

  • 硬件:华为昇腾 NPU (Ascend910B)
  • 框架:PyTorch + torch_npu
  • 模型:deit3_base_patch16_224.fb_in1k(ViT-Base,Patch16,224x224,1000 类)
  • 权重:ModelScope snapshot_download (model.safetensors, 330MB)

3. 推理运行

python inference.py

输出示例(随机测试图片):

Top-5 predictions:
  1. class_0460 (39.27%)
  2. class_0565 (9.91%)
  3. class_0547 (9.18%)
  4. class_0920 (7.36%)
  5. class_0525 (6.07%)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.100382
mean_abs_error0.058626
relative_error0.7739%
cosine_similarity0.999998
threshold1.0%
结果PASS
  • CPU Top-1: class_0460
  • NPU Top-1: class_0460
  • Top-1 match: True

5. 性能参考

指标数值
avg_latency8.69 ms
min_latency5.58 ms
max_latency35.68 ms
p50_latency5.69 ms
p90_latency8.84 ms
p95_latency22.26 ms
throughput115.07 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log — 推理输出日志
  • logs/accuracy.log — CPU-NPU 精度一致性检查日志
  • logs/benchmark.log — 性能基准测试日志

9. 注意事项

  • 使用 timm.create_model(pretrained=False) + ModelScope 本地权重,不使用 HuggingFace 直连下载
  • 不提交权重文件(*.safetensors, *.bin 等已 gitignore)
  • 精度验证为单图 smoke check,非 ImageNet 完整评测

10. 标签

#NPU