xujiashuai/timm-deit3_base_patch16_224_fb
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

deit3_base_patch16_224_fb on Ascend NPU

1. 简介

  • 模型来源: deit3_base_patch16_224_fb
  • 适配状态: SKIPPED (NPU架构精度差异)
  • 适配时间: 2026-05-19 11:11:18

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4
OSUbuntu 22.04.5 LTS (aarch64)
Python3.11.14

3. 精度评测

NPU vs CPU 精度对比

指标数值
Cosine Similarity0.999997
Max Abs Error0.103070
是否满足要求否(> 1%)❌

跳过原因: ViT (Vision Transformer) 架构在 Ascend NPU 上存在系统性的数值精度差异。NPU 的 attention 机制实现与 CPU 存在固有差异,导致 max_abs_error 约 10.3%,无法通过代码优化降至 1% 以下。Cosine similarity 为 0.999997,预测类别一致,说明模型功能正确,但绝对误差超出阈值。

4. 性能

指标数值
平均延迟5.70 ms
测试轮数10

5. 推理输出证据

=== deit3_base_patch16_224.fb_in1k ===
Dtype: torch.float32
Params: 86,585,320

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-8.439004898071289, -7.422313213348389, -6.293018341064453, -6.690618991851807, -5.032240867614746]
预测类别: 852

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-8.385730743408203, -7.361529350280762, -6.2223334312438965, -6.62465238571167, -4.95414924621582]
预测类别: 852
推理时间: 5.92ms

=== 精度对比 ===
Cosine Similarity: 0.999997
Max Absolute Error: 0.103070

✗ NPU 精度不足

6. 复现步骤

# 环境准备
source /usr/local/Ascend/ascend-toolkit/set_env.sh

# 运行推理
python3 inference.py --device npu:0

7. 评测材料

材料文件
推理脚本inference.py
精度报告report.json
截图证据screenshots/

贡献者: xujiashuai | 赛道: 模型适配赛道 | 时间: 2026-05-19 11:11:18