xujiashuai/timm-swinv2_large_window12to24_192to384.ms_in22k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/swinv2_large_window12to24_192to384.ms_in22k_ft_in1k - 昇腾NPU适配

1. 模型概述

SwinV2 Large是一个大型层次化视觉Transformer,采用移位窗口机制,在ImageNet-22k上进行训练,并在ImageNet-1k上进行微调。它采用渐进式窗口大小从12增加到24,分辨率从192增加到384。

  • 原始模型:timm/swinv2_large_window12to24_192to384.ms_in22k_ft_in1k
  • 架构:SwinV2 Transformer(Large)
  • 参数:196,739,932
  • 输入分辨率:384x384
  • 输出类别:1000

2. NPU适配

  • 设备:昇腾NPU(npu:0)
  • 框架:PyTorch + torch_npu

3. 精度

指标数值
余弦相似度0.999992
最大绝对误差0.006605

4. 延迟

设备平均延迟
NPU(npu:0)74.61 ms

5. CPU与NPU对比

指标CPUNPU
输出形状[1, 1000][1, 1000]
预测结果111111

6. 使用方法

source setup_env.sh
HF_ENDPOINT=https://hf-mirror.com python3 inference.py --device npu:0