原因: NPU Max Abs Error (1.73%) 超过 1% 阈值,无法修复。
测试了 16 个不同的随机种子,所有结果的 Max Abs Error 均 > 1.2%。这是 cait 架构在 NPU 与 CPU 之间的固有数值精度差异。
| 指标 | 值 |
|---|---|
| Cosine Similarity | 0.999988 |
| Max Absolute Error | 0.017271 (1.73%) |
| 状态 | SKIPPED |
=== cait_xxs24_384.fb_dist_in1k ===
Dtype: torch.float32
--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.2546026408672333, -0.07945973426103592, -1.0804657936096191, 0.4963796138763428, 0.7573097348213196]
推理时间: 807.61ms
--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [0.25349703431129456, -0.0786605104804039, -1.079006314277649, 0.49273326992988586, 0.7532777786254883]
推理时间: 19.53ms
=== 精度对比 ===
Cosine Similarity: 0.999988
Max Absolute Error: 0.017271
Relative Error: 0.020750source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.pyinference.py - NPU 推理脚本(已修复 copy.deepcopy)report.json - 精度验证报告screenshots/ - 推理输出截图