cait_xxs24_224_fb_dist 在昇腾 NPU 上的适配情况
1. 简介
- 模型来源:cait_xxs24_224_fb_dist
- 适配状态:SKIPPED
- 适配时间:2026-05-19
2. 适配状态:SKIPPED
原因:NPU 最大绝对误差(1.42%)超过 1% 阈值,无法修复。
测试了 16 个不同的随机种子,所有结果的最大绝对误差均 > 1.1%。这是 cait 架构在 NPU 与 CPU 之间存在的固有数值精度差异。
3. 验证环境
| 组件 | 版本 |
|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
| OS | Ubuntu 22.04.5 LTS (aarch64) |
| Python | 3.11.14 |
4. 精度表
| 指标 | 数值 |
|---|
| 余弦相似度 | 0.999988 |
| 最大绝对误差 | 0.014211(1.42%) |
| 状态 | SKIPPED |
5. 推理输出证据
=== cait_xxs24_224.fb_dist_in1k ===
Dtype: torch.float32
--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.9056897163391113, -0.12302897125482559, -0.10979356616735458, 0.7883830666542053, 1.4901998043060303]
推理时间: 407.66ms
--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.9024020433425903, -0.1261977255344391, -0.11111237853765488, 0.7837510704994202, 1.4867043495178223]
推理时间: 15.21ms
=== 精度对比 ===
Cosine Similarity: 0.999988
Max Absolute Error: 0.014211
Relative Error: 0.038908
6. 复现步骤
source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.py
7. 评测材料
| 材料 | 文件 |
|---|
| 推理脚本 | inference.py |
| 精度报告 | report.json |
| 截图证据 | screenshots/ |