m
mxy-yy/dinov3-vitb16-pretrain-lvd1689m-npu
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

DINOv3-ViT-B16 昇腾 NPU 部署指南

环境信息

项目版本/内容
设备Ascend 910B

文件结构

dinov3-vitb16-pretrain-lvd1689m-ascend/  # 适配代码
├── inference.py                    # 推理脚本
└── README.md                       # 本文档

运行推理

精度测试

cd /opt/atomgit/mxy/dinov3-vitb16-pretrain-lvd1689m-ascend
python inference.py --model_path /opt/atomgit/mxy/dinov3-vitb16-pretrain-lvd1689m --precision_test

图像推理

cd /opt/atomgit/mxy/dinov3-vitb16-pretrain-lvd1689m-ascend
python inference.py --model_path /opt/atomgit/mxy/dinov3-vitb16-pretrain-lvd1689m --image_path /tmp/test_image.jpg --device npu:0

参数说明

参数说明默认值
--model_path模型权重路径必需
--image_path待推理图像路径必需(精度测试时不需要)
--precision_test运行精度测试False
--device运行设备npu:0

精度测试结果

========================================================
Precision Comparison: CPU vs NPU
========================================================
Max errors: sum=9.16e-05, mean=1.19e-07, std=2.98e-08
PASS: NPU precision within thresholds
========================================================
PRECISION TEST PASSED
========================================================
指标阈值实测值状态
max_error_sum< 1e-39.16e-05✅ PASS
max_error_mean< 1e-51.19e-07✅ PASS
max_error_std< 1e-52.98e-08✅ PASS

输出示例

2026-05-11 07:13:14,968 - INFO - DINOv3-ViT-B16 昇腾 NPU 推理
2026-05-11 07:13:17,549 - INFO - 模型已加载到设备: npu:0
2026-05-11 07:13:17,549 - INFO - 开始预热...
2026-05-11 07:13:17,860 - INFO - 预热完成
2026-05-11 07:13:17,860 - INFO - 开始推理...
2026-05-11 07:13:17,862 - INFO - 推理耗时: 0.0178s
2026-05-11 07:13:17,862 - INFO - 池化输出形状: torch.Size([1, 768])
2026-05-11 07:13:17,862 - INFO - 隐藏状态形状: torch.Size([1, 201, 768])
2026-05-11 07:13:17,862 - INFO - 推理成功完成!

注意事项

  1. 推理性能:推理时间约 18ms/图
  2. NPU 可用性:容器内 torch.npu.is_available() 返回 True,8卡均正常
  3. 精度测试:测试20个state_dict tensor的CPU vs NPU精度差异