d
dingdang666/rad-dino-NPU
模型介绍文件和版本Pull Requests讨论分析

rad-dino on Ascend NPU

1. 简介

本文档记录 rad-dino(Microsoft RAD-DINO,医学胸片视觉编码器)在昇腾 NPU(Ascend 910B3)环境的适配部署与精度验证结果。

RAD-DINO 基于 DINOv2 自监督学习方法在 88 万张胸片(MIMIC-CXR、CheXpert、NIH-CXR、PadChest、BRAX)上训练,参数量约 86.6M,输出 768 维图像特征向量。本项目完成该模型在昇腾 NPU 上的推理适配,验证 NPU 与 CPU 结果的精度误差 < 1%。

相关地址:

  • 权重下载地址(HuggingFace):https://huggingface.co/microsoft/rad-dino
  • 论文:https://www.nature.com/articles/s42256-024-00965-w
  • 适配代码仓库:https://gitcode.com/dingdang666/rad-dino-NPU

2. 验证环境

组件版本
Python3.11.x
PyTorch2.10.0+cpu
torch_npu2.10.0
transformers5.8.1
safetensors0.7.0
CANN8.5.1
NPU 硬件Ascend 910B3

3. 模型信息

项目值
模型架构ViT-Base/14 (DINOv2)
参数量~86.6M
特征维度768
Layers12
Attention Heads12
Patch Size14
输入尺寸3×518×518 (center crop)
图像均值/标准差0.5307 / 0.2583 (MIMIC-CXR stats)
权重格式safetensors
框架PyTorch (transformers)
预训练数据882K 胸片 (5 datasets)
许可证MSRLA

4. Conda 环境安装

conda create -n rad-dino python=3.11 -y
conda activate rad-dino
pip install torch==2.10.0 torchvision==0.25.0 --index-url https://repo.huaweicloud.com/repository/pypi/simple/
pip install torch_npu==2.10.0 --index-url https://repo.huaweicloud.com/repository/pypi/simple/
pip install transformers safetensors pillow --index-url https://repo.huaweicloud.com/repository/pypi/simple/

5. 推理执行

# NPU
python3 inference.py --model_path /path/to/rad-dino --image_path /path/to/xray.jpg

# CPU
python3 inference.py --model_path /path/to/rad-dino --image_path /path/to/xray.jpg --device cpu

# 评测
python3 benchmark.py --model_path /path/to/rad-dino

6. 参数说明

inference.py默认值
--devicenpu:0
--no_warmupFalse
benchmark.py默认值
--npu_devicenpu:0
--num_warmup3

7. 精度评测结果

输出张量向量级相对误差余弦相似度最大绝对误差平均绝对误差
features0.251017%0.9999970198——
指标实测值阈值状态
向量级相对误差0.25%< 1%PASS
余弦相似度0.999997> 0.99PASS

8. 性能数据

操作耗时
CPU 推理时间(FP32)3.99s
NPU 推理时间(FP32,3轮预热后)0.36s
加速比11.23x

9. 注意事项

  1. 使用医学影像专用的归一化参数(mean=0.5307, std=0.2583),与标准 ImageNet 不同。
  2. 预处理使用 BitImageProcessor,执行 resize + center crop 到 518×518。
  3. 模型基于 transformers Dinov2Model 加载。
  4. 权重文件不包含在适配仓库中,需从 HuggingFace 下载。
下载使用量0