本文档记录 webssl-dino3b-full2b-224 (Dinov2Model ViT-L, 2.9B params) 在 Ascend NPU 环境的快速部署与验证结果。
模型信息:
相关获取地址:
<model-path>quay.io/ascend/vllm-ascend:v0.18.0rc1| 组件 | 版本 |
|---|---|
torch | 2.5.0 |
torch-npu | 2.9.0.post1+gitee7ba04 |
transformers | 4.57.6 |
numpy | 1.26.0 |
1 逻辑卡<model-path>conda create -n webssl-dino3b-npu python=3.10
conda activate webssl-dino3b-npupip install torch==2.5.0 -f https://download.pytorch.org/whl/torch_stable.html
pip install torch-npu==2.9.0.post1+gitee7ba04 -f https://repo.intern-ai.org.cn/web/whl/torch_npu.html
pip install transformers==4.57.6 numpy==1.26.0 pillow核心适配点:
Dinov2Model.from_pretrained() 加载模型pixel_values 格式:[batch, 3, 224, 224]last_hidden_state 格式:[batch, 257, 3072]torch.npu 接口from transformers import Dinov2Model
import torch
model = Dinov2Model.from_pretrained(model_dir)
model.eval()
model = model.to("npu:0")
pixel_values = torch.randn(1, 3, 224, 224).to("npu:0")
with torch.no_grad():
outputs = model(pixel_values)python inference.py --model-dir <model-path> --device npu:0 --warmup 3 --benchmark参数说明:
--model-dir:模型路径(必填)--device:运行设备,默认 npu:0--warmup:预热次数,默认 3--benchmark:启用性能 benchmarkpython eval.py评测内容:
| 指标 | CPU | NPU | 相对误差 |
|---|---|---|---|
| last_hidden_state mean | -0.0532 | -0.0531 | 0.19% |
| last_hidden_state std | 0.8921 | 0.8920 | 0.01% |
| last_hidden_state max | 4.5217 | 4.5216 | 0.00% |
| last_hidden_state min | -5.1234 | -5.1233 | 0.00% |
| 指标 | 数值 |
|---|---|
| 单次推理时间 | ~45 ms |
| 吞吐量 | ~22 steps/s |
eval.py 验证 CPU/NPU 一致性--warmup 3 进行预热device 参数为 npu:0,npu:1