xujiashuai/timm-cait_xxs24_224_fb_dist
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

cait_xxs24_224_fb_dist 在昇腾 NPU 上的适配情况

1. 简介

  • 模型来源:cait_xxs24_224_fb_dist
  • 适配状态:SKIPPED
  • 适配时间:2026-05-19

2. 适配状态:SKIPPED

原因:NPU 最大绝对误差(1.42%)超过 1% 阈值,无法修复。

测试了 16 个不同的随机种子,所有结果的最大绝对误差均 > 1.1%。这是 cait 架构在 NPU 与 CPU 之间存在的固有数值精度差异。

3. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4
OSUbuntu 22.04.5 LTS (aarch64)
Python3.11.14

4. 精度表

指标数值
余弦相似度0.999988
最大绝对误差0.014211(1.42%)
状态SKIPPED

5. 推理输出证据

=== cait_xxs24_224.fb_dist_in1k ===
Dtype: torch.float32

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.9056897163391113, -0.12302897125482559, -0.10979356616735458, 0.7883830666542053, 1.4901998043060303]
推理时间: 407.66ms

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.9024020433425903, -0.1261977255344391, -0.11111237853765488, 0.7837510704994202, 1.4867043495178223]
推理时间: 15.21ms

=== 精度对比 ===
Cosine Similarity: 0.999988
Max Absolute Error: 0.014211
Relative Error: 0.038908

6. 复现步骤

source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.py

7. 评测材料

材料文件
推理脚本inference.py
精度报告report.json
截图证据screenshots/