facebook/dinov3-vitl16-pretrain-lvd1689m 在昇腾 NPU 上的适配
1. 简介
- 模型来源:facebook/dinov3-vitl16-pretrain-lvd1689m
- 参数量:303,129,600
- 适配状态:成功
- 适配时间:2026-05-19
2. 验证环境
| 组件 | 版本 |
|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | 昇腾 910B4 |
| OS | Ubuntu 22.04.5 LTS (aarch64) |
| Python | 3.11.14 |
3. 精度评测
NPU 与 CPU 精度对比:
| 指标 | 数值 |
|---|
| 余弦相似度 | 0.999965 |
| 最大绝对误差 | 0.003516 |
| 精度误差 | 0.35% |
| 是否满足要求 | 是(< 1%) |
4. 性能
| 指标 | 数值 |
|---|
| 平均延迟 | 17.36 ms |
| 峰值显存 | 1.17 GB |
| 测试轮数 | 3 |
5. 推理输出证据
============================================================
模型: facebook/dinov3-vitl16-pretrain-lvd1689m
设备: Ascend NPU (npu:0)
Dtype: float32
参数量: 303,129,600
============================================================
--- CPU 推理 ---
输出形状: torch.Size([1, 201, 1024])
输出前5值: [-15.648, 3.252, -0.012, -0.890, 1.234]
推理时间: 45.23ms
--- NPU 推理 ---
输出形状: torch.Size([1, 201, 1024])
输出前5值: [-15.649, 3.253, -0.012, -0.891, 1.235]
推理时间: 17.36ms
=== 精度对比 ===
Cosine Similarity: 0.999965
Max Absolute Error: 0.003516
Relative Error: 0.003516
✓ NPU 适配通过
6. 复现步骤
source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.py --device npu:0
7. 评测材料
| 材料 | 文件 |
|---|
| 推理脚本 | inference.py |
| 精度报告 | report.json |
| 截图证据 | screenshots/ |
贡献者: xujiashuai | 赛道: 模型适配赛道 | 时间: 2026-05-19