ViT-B/16 图像分类模型,使用 LoRA 高效微调,100 类分类任务。
| 指标 | 值 |
|---|---|
| 余弦相似度 | 0.999986 |
| 平均延迟 | 5.48 ms |
| 参数量 | ~86M |
| 推理精度 | float16 |
| 设备 | Ascend 910B4 |
| 组件 | 版本 |
|---|---|
| CANN | 8.5.1 |
| torch_npu | 2.9.0.post1 |
| PyTorch | 2.9.0 |
| Python | 3.11 |
export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float16NPU 推理输出(float16, 224x224):
模型: iic/cv_vitb16_classification_vision-efficient-tuning-lora
设备: npu:0
精度: float16
------------------------------------------------------------
logits: shape=torch.Size([1, 100])
logits (first 10): [-0.6260, -2.3730, 0.7427, -0.5493, -1.2832, -0.4919, -0.6758, 0.3826, -0.3154, 0.8086]
predicted class: 61
Cosine Similarity (logits): 0.999986
✓ 推理完成
平均延迟: 5.48 ms| 指标 | CPU (float32) | NPU (float16) | 误差 |
|---|---|---|---|
| 余弦相似度 | 基准 | 0.999986 | < 0.002% |
| 预测类别 | 61 | 61 | 一致 |
| 输出维度 | [1,100] | [1,100] | 一致 |
本适配由 batch-adapter 自动完成。