xujiashuai/cv_beitv2-large_image-classification_patch16_224_pt1k_ft22k_in1k
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

cv_beitv2-large_image-classification_patch16_224_pt1k_ft22k_in1k - 昇腾 NPU 适配

1. 模型简介

BEiTv2 Large 图像分类模型,基于 Vision Transformer-Large 架构(24层,1024隐藏层),在 ImageNet-1k 上进行微调。

  • 原始模型:iic/cv_beitv2-large_image-classification_patch16_224_pt1k_ft22k_in1k
  • 框架:PyTorch + timm
  • 任务:图像分类(ImageNet-1k 1000类)
  • 骨干网络:BEiTv2-Large(24层,1024隐藏层,16头)

2. 昇腾 NPU 适配结果

指标值
余弦相似度1.000000
最大绝对误差0.000000
平均延迟16.86ms
输出维度(1, 1000)
推理精度float32
设备Ascend 910B4

3. 环境要求

组件版本
CANN8.5.1
torch_npu2.9.0.post1
PyTorch2.9.0
Python3.11
timmlatest

4. 快速使用

export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH

python inference.py
python evaluate.py

5. 推理输出证据

Model: iic/cv_beitv2-large_image-classification_patch16_224_pt1k_ft22k_in1k
Device: npu:0
Output shape: [1, 1000]
Output sample: [-0.0008012278703972697, 0.0007319471333175898, 0.0005658459849655628, 0.001482490450143814, -0.000631795555818826]
Latency: 16.86ms

--- CPU vs NPU 精度对比 ---
Cosine Similarity: 1.000000
Max Abs Error: 0.000000
SUCCESS

6. CPU 与 NPU 精度对比

指标CPU (float32)NPU (float32)误差
余弦相似度基准1.0000000
最大绝对误差-0.000000-
输出维度(1, 1000)(1, 1000)一致

7. 模型结构

  • 骨干网络:BEiTv2-Large(24 层)
  • 隐藏层大小:1024
  • 注意力头数:16
  • ** patch 大小**:16
  • 图像尺寸:224
  • 类别数量:1000