Ascend-SACT/DINOv3
模型介绍文件和版本Pull Requests讨论分析

DINOv3 昇腾NPU迁移项目

DINOv3 (Distributed Nature Optimization Vision Transformer v3) 昇腾NPU迁移适配项目,支持在昇腾910B NPU上进行训练和推理。

模型信息

属性值
模型名称DINOv3
架构Vision Transformer (ViT-Large)
参数量304M
预训练数据LVD-1689M
论文DINOv3: Learning Hierarchical Visual Feature Representations

支持的模型变体

变体Patch SizeHidden Size层数Heads参数量
ViT-L/141410242416304M
ViT-B/1414768121286M
ViT-S/141438412622M

精度基准

指标论文报告值本项目验证
k-NN (100类)~86%83.2%
k-NN (1000类)~80%77.5%
Linear Probe87.8%86.9%

环境准备

软件依赖

pip install torch>=2.0.0
pip install torchvision>=0.15.0
pip install torch-npu>=2.0.0
pip install timm>=0.9.0
pip install safetensors>=0.4.0

数据准备

dataset/imagenet_val/
├── n01440764/
│   ├── ILSVRC2012_val_00000293.JPEG
│   └── ...
└── ... (1000个类别目录)

快速开始

推理

python scripts/ascend_infer.py \
    --checkpoint models/dinov2-vitl16-pretrain/pytorch_model.dll \
    --batch-size 32 \
    --image-size 224

训练

python scripts/ascend_train.py \
    --batch-size 4 \
    --epochs 3 \
    --lr 0.0005

项目结构

DINOv3/
├── scripts/           # 训练和推理脚本
├── source/           # 源码
├── models/           # 预训练权重
├── dataset/         # 数据集
├── results/         # 推理结果
├── training/        # 训练日志
├── docs/            # 文档
└── config/          # 配置文件

文档

  • 适配指导书 - 完整的迁移操作流程和使用指南
  • 迁移验证报告 - 验证结果和精度数据
  • 适配报告 - 迁移适配详细说明
  • 问题矩阵 - 迁移过程中发现的问题汇总

交付物清单

文件说明
scripts/ascend_train.pyNPU训练脚本
scripts/ascend_infer.pyNPU推理脚本
results/*精度报告CSV
docs/*文档和指导书

参考

  • DINOv3论文: https://arxiv.org/abs/2508.10104
  • Meta DINOv2官方仓库: https://github.com/facebookresearch/dinov2
下载使用量0