webssl-dino7b-full8b-224 是一个 7B 参数的 Vision Transformer 模型,本项目提供其在华为 Ascend NPU 环境下的部署方案。
| 项目 | 版本/内容 |
|---|---|
| 设备 | Ascend 910B |
webssl-dino7b-full8b-224-ascend/
├── inference.py # 精度测试脚本
├── test.log # 测试日志
├── README.md # 本文档
├── test_image_0.png # 测试图片样本
├── test_image_1.png
├── test_image_2.png
└── fusion_result.json # 融合结果source /usr/local/Ascend/ascend-toolkit/set_env.sh模型文件应放在 webssl-dino7b-full8b-224/ 目录下:
cd webssl-dino7b-full8b-224-ascend/
python3 inference.py| 指标 | 实测值 | 阈值 | 状态 |
|---|---|---|---|
| Max error (mean) | 6.55e-05 | < 1.00e-04 | PASS |
| Max error (std) | 1.96e-04 | < 1.00e-03 | PASS |
| 操作 | 耗时 |
|---|---|
| 模型加载 | 41.97s |
| NPU 推理 (224x224 image) | 5.01s |
| CPU 参考计算 (20 tensors) | 3.47s |
| NPU 张量读取 | 0.17s |
完整测试日志保存在 test.log
| 张量名称 | Sum Error | Mean Error | Std Error |
|---|---|---|---|
| embeddings.cls_token | 6.22e-05 | 1.52e-08 | 2.14e-08 |
| embeddings.mask_token | 2.56e-03 | 6.25e-07 | 1.09e-06 |
| embeddings.position_embeddings | 2.20e-02 | 2.09e-08 | 1.02e-07 |
| encoder.layer.0.norm1.weight | 1.01e-01 | 2.48e-05 | 1.62e-04 |
| encoder.layer.0.attention.attention.key.bias | 2.68e-01 | 6.55e-05 | 8.08e-05 |
A: 检查 NPU 驱动是否正确安装,确保 CANN 环境变量已 source。
A: 首次加载会读取6个分片文件,后续调用会使用缓存。