xujiashuai/cv_swinv2-base_patch4_window16_256
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

cv_swinv2-base_patch4_window16_256 在昇腾 NPU 上的表现

1. 简介

  • 模型来源:microsoft/swinv2-base-patch4-window16-256
  • 架构:SwinV2-Base(patch_size=4,window_size=16,embed_dim=128)
  • 参数量:86,893,816
  • 任务:图像分类(ImageNet-22k 预训练)
  • 适配状态:成功
  • 适配时间:2026-05-17

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度0.999989
最大绝对误差0.005416
是否满足要求是(< 1%)

4. 性能

指标数值
平均延迟29.39 毫秒
输出形状[1, 64, 1024]

5. 适配说明

使用 transformers Swinv2Model.from_pretrained 直接加载预训练权重。输入为随机图像张量 (1, 3, 256, 256),比较 last_hidden_state 输出。

6. 推理输出证据

Model: cv_swinv2-base_patch4_window16_256
Output shape: [1, 64, 1024]
Latency: 29.39ms
Cosine Similarity: 0.999989
Max Abs Error: 0.005416

7. CPU 与 NPU 精度对比

指标CPUNPU差异
余弦相似度1.00.9999890.0011%
最大绝对误差-0.005416-