xujiashuai/cv_vitb16_classification_vision-efficient-tuning-prompt
模型介绍文件和版本Pull Requests讨论分析

ViT-B/16 视觉高效调优 - 提示词(cv_vitb16_classification_vision-efficient-tuning-prompt)

基于提示词调优的ViT-B/16图像分类模型。提示词令牌在每个Transformer块的补丁嵌入前添加。

  • 模型ID:iic/cv_vitb16_classification_vision-efficient-tuning-prompt
  • 任务:图像分类(CIFAR-100,100类)
  • 框架:PyTorch
  • 骨干网络:ViT-B/16(patch_size=16,embed_dim=768,depth=12,num_heads=12)
  • 提示词长度:每块10个令牌

验证环境

项目数值
NPUAscend910B4
CANN8.5.1
PyTorch2.9.0+cpu
torch_npu2.9.0.post1
Python3.11.14

精度评估

CPU与NPU余弦相似度:

指标数值
余弦相似度0.999992

推理输出

Output shape: [1, 100]
Logits sample: [-1.027, -3.788, 0.819, -1.239, -1.530]
Predicted class: 61
SUCCESS

复现

python3 inference.py
python3 evaluate.py

材料

  • inference.py - NPU 推理脚本
  • evaluate.py - CPU 与 NPU 余弦相似度评估
下载使用量0