xujiashuai/cv_vitb16_classification_vision-efficient-tuning-prefix
模型介绍文件和版本Pull Requests讨论分析

cv_vitb16_classification_vision-efficient-tuning-prefix 在昇腾 NPU 上的适配

1. 简介

  • 模型来源: iic/cv_vitb16_classification_vision-efficient-tuning-prefix
  • 架构: VisionTransformerPETL(ViT-B/16 + Prefix Tuning)
  • 参数量: 86,059,876
  • 任务: 图像分类(CIFAR-100,100类)
  • PETL 方法: Prefix Tuning(prefix_length=10)
  • 适配状态: 成功
  • 适配时间: 2026-05-17

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPU昇腾 910B4

3. 精度评测

指标数值
余弦相似度0.999993
最大绝对误差0.024873
是否满足要求是(< 1%)

4. 性能

指标数值
平均延迟6.45 毫秒
输出形状[1, 100]

5. 适配说明

使用 modelscope VisionTransformerPETL 加载预训练权重,通过 prefix_length=10 启用 Prefix Tuning PETL 方法。输入为随机图像张量 (1, 3, 224, 224)。

6. 推理输出证据

Model: iic/cv_vitb16_classification_vision-efficient-tuning-prefix
Output shape: [1, 100]
Latency: 6.45ms
Cosine Similarity: 0.999993
Max Abs Error: 0.024873

7. CPU 与 NPU 精度对比

指标CPUNPU差异
余弦相似度1.00.9999930.0007%
最大绝对误差-0.024873-
下载使用量0