xujiashuai/timm-deit3_large_patch16_224_fb
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

deit3_large_patch16_224_fb on Ascend NPU

1. 简介

  • 模型来源: deit3_large_patch16_224_fb
  • 适配状态: SKIPPED (NPU架构精度差异)
  • 适配时间: 2026-05-19 11:11:18

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4
OSUbuntu 22.04.5 LTS (aarch64)
Python3.11.14

3. 精度评测

NPU vs CPU 精度对比

指标数值
Cosine Similarity0.999999
Max Abs Error0.073303
是否满足要求否(> 1%)❌

跳过原因: ViT (Vision Transformer) 架构在 Ascend NPU 上存在系统性的数值精度差异。NPU 的 attention 机制实现与 CPU 存在固有差异,导致 max_abs_error 约 7.3%,无法通过代码优化降至 1% 以下。

4. 性能

指标数值
平均延迟11.21 ms
测试轮数10

5. 推理输出证据

=== deit3_large_patch16_224.fb_in1k ===
Dtype: torch.float32
Params: 304,374,760

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-8.687372207641602, -8.510026931762695, -6.981428623199463, -6.7738471031188965, -4.787087440490723]
预测类别: 539

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-8.649762153625488, -8.470376014709473, -6.934642314910889, -6.726249694824219, -4.733721733093262]
预测类别: 539
推理时间: 11.50ms

=== 精度对比 ===
Cosine Similarity: 0.999999
Max Absolute Error: 0.073303

✗ NPU 精度不足

6. 复现步骤

# 环境准备
source /usr/local/Ascend/ascend-toolkit/set_env.sh

# 运行推理
python3 inference.py --device npu:0

7. 评测材料

材料文件
推理脚本inference.py
精度报告report.json
截图证据screenshots/

贡献者: xujiashuai | 赛道: 模型适配赛道 | 时间: 2026-05-19 11:11:18