g
gyccc/timm-deit3_base_patch16_224.fb_in22k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/deit3_base_patch16_224.fb_in22k_ft_in1k on Ascend NPU

1. 简介

将 timm 预训练视觉模型 deit3_base_patch16_224.fb_in22k_ft_in1k(DeiT3 Base,ImageNet-22k 预训练后微调至 ImageNet-1k)适配到单卡昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重,不使用 HuggingFace 直连下载。

2. 验证环境

项目配置
NPUAscend910_9362 (单卡)
CANN8.5.1
PyTorch2.9.0+cpu
torch_npu可用
Python3.11
模型参数量86,585,320
权重大小330.3 MB (safetensors)

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

输出示例:

Top-1: class_549 (0.0308)
Top-2: class_399 (0.0189)
Top-3: class_700 (0.0185)
Top-4: class_21 (0.0126)
Top-5: class_473 (0.0115)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.015274
mean_abs_error0.002559
relative_error0.3375%
cosine_similarity0.999994
threshold1.0%
结果PASS
  • CPU Top-1: class_549
  • NPU Top-1: class_549
  • CPU Top-5: class_549, class_399, class_700, class_21, class_473
  • NPU Top-5: class_549, class_399, class_700, class_21, class_473
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
平均推理延迟5.86 ms
最小延迟5.77 ms
最大延迟5.93 ms
p505.86 ms
p905.93 ms
p955.93 ms
吞吐量170.63 images/sec

测试条件:batch=1, 224x224 输入, 2 次预热 + 10 次正式测试, Ascend910 单卡。

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log - 推理输出日志
  • logs/accuracy.log - CPU-NPU 精度一致性验证日志
  • logs/benchmark.log - 性能基准测试日志
  • logs/env_check.log - 环境检查日志

9. 注意事项

  • 使用 pretrained=False + 本地权重加载,不使用 HuggingFace 自动下载
  • 权重文件(.safetensors / .bin)不提交到仓库
  • 本验证为单图 smoke test,非 ImageNet 完整验证集评测
  • DeiT3 Base 为 Vision Transformer 架构,86.5M 参数,ImageNet-22k 预训练后微调

10. 标签

#NPU