ViT-B/16 图像分类模型,采用 UTuning(适配器 + 前缀 + 提示)高效微调方法,在 CIFAR-100 数据集上完成训练。
| 指标 | 值 |
|---|---|
| 余弦相似度 | 0.999998 |
| 平均延迟 | 7.70 ms |
| 推理精度 | float16 |
| 设备 | Ascend 910B4 |
export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float16模型: iic/cv_vitb16_classification_vision-efficient-tuning-utuning
设备: npu:0
精度: float16
------------------------------------------------------------
input: shape=torch.Size([1, 3, 224, 224])
logits: shape=torch.Size([1, 100])
CPU pred: woman, NPU pred: woman
Cosine Similarity (logits): 0.999998
✓ 推理完成
平均延迟: 7.70 ms| 指标 | CPU (float32) | NPU (float16) | 误差 |
|---|---|---|---|
| 余弦相似度 | 基准 | 0.999998 | < 0.001% |
| 输出维度 | [1,100] | [1,100] | 一致 |
| 预测类别 | woman | woman | 一致 |
本适配由 batch-adapter 自动完成。