cait_xxs36_224_fb_dist 在昇腾 NPU 上的适配情况
1. 简介
- 模型来源:cait_xxs36_224_fb_dist
- 适配状态:SKIPPED
- 适配时间:2026-05-19
2. 适配状态:SKIPPED
原因:NPU 最大绝对误差(1.57%)超过 1% 阈值,无法修复。
测试了 16 个不同的随机种子,所有结果的最大绝对误差均 > 1.5%。这是 cait 架构在 NPU 与 CPU 之间存在的固有数值精度差异。
3. 验证环境
| 组件 | 版本 |
|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
| OS | Ubuntu 22.04.5 LTS (aarch64) |
| Python | 3.11.14 |
4. 精度表
| 指标 | 数值 |
|---|
| 余弦相似度 | 0.999968 |
| 最大绝对误差 | 0.015675(1.57%) |
| 状态 | SKIPPED |
5. 推理输出证据
=== cait_xxs36_224.fb_dist_in1k ===
Dtype: torch.float32
--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.28012052178382874, -0.20602960884571075, -0.3316996395587921, 0.46965256333351135, 0.7722240090370178]
推理时间: 697.67ms
--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.2855377793312073, -0.1985999345779419, -0.3268318474292755, 0.47582539916038513, 0.7794729471206665]
推理时间: 22.48ms
=== 精度对比 ===
Cosine Similarity: 0.999968
Max Absolute Error: 0.015675
Relative Error: 0.044747
6. 复现步骤
source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.py
7. 评测材料
| 材料 | 文件 |
|---|
| 推理脚本 | inference.py |
| 精度报告 | report.json |
| 截图证据 | screenshots/ |