cv_vitb16_classification_vision-efficient-tuning-prefix 在昇腾 NPU 上的适配
1. 简介
- 模型来源: iic/cv_vitb16_classification_vision-efficient-tuning-prefix
- 架构: VisionTransformerPETL(ViT-B/16 + Prefix Tuning)
- 参数量: 86,059,876
- 任务: 图像分类(CIFAR-100,100类)
- PETL 方法: Prefix Tuning(prefix_length=10)
- 适配状态: 成功
- 适配时间: 2026-05-17
2. 验证环境
| 组件 | 版本 |
|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | 昇腾 910B4 |
3. 精度评测
| 指标 | 数值 |
|---|
| 余弦相似度 | 0.999993 |
| 最大绝对误差 | 0.024873 |
| 是否满足要求 | 是(< 1%) |
4. 性能
| 指标 | 数值 |
|---|
| 平均延迟 | 6.45 毫秒 |
| 输出形状 | [1, 100] |
5. 适配说明
使用 modelscope VisionTransformerPETL 加载预训练权重,通过 prefix_length=10 启用 Prefix Tuning PETL 方法。输入为随机图像张量 (1, 3, 224, 224)。
6. 推理输出证据
Model: iic/cv_vitb16_classification_vision-efficient-tuning-prefix
Output shape: [1, 100]
Latency: 6.45ms
Cosine Similarity: 0.999993
Max Abs Error: 0.024873
7. CPU 与 NPU 精度对比
| 指标 | CPU | NPU | 差异 |
|---|
| 余弦相似度 | 1.0 | 0.999993 | 0.0007% |
| 最大绝对误差 | - | 0.024873 | - |