g
gyccc/timm-swin_small_patch4_window7_224.ms_in22k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/swin_small_patch4_window7_224.ms_in22k - 昇腾NPU

Swin Transformer Small在ImageNet-22k(21841个类别)上进行预训练,通过PyTorch + torch_npu适配单卡华为昇腾NPU推理。

项目数值
模型timm/swin_small_patch4_window7_224.ms_in22k
架构Swin Transformer Small
预训练ImageNet-22k(微软)
输入分辨率224x224
num_classes21841
硬件华为昇腾NPU

推理

pip install -r requirements.txt
python3 inference.py

assets/test.jpg的Top-5预测结果:

排名类别ID得分
Top-195350.0041
Top-275850.0030
Top-392690.0028
Top-450600.0027
Top-570020.0026

精度

python3 eval_accuracy.py

单张测试图像上的CPU与NPU一致性检查:

指标数值
max_abs_error0.008706
mean_abs_error0.001523
relative_error0.1555%
cosine_similarity0.999999
top1_matchTrue
top5_matchTrue
CPU Top-5[9535, 7585, 9269, 5060, 7002]
NPU Top-5[9535, 7585, 9269, 5060, 7002]
结果PASS

性能基准测试

python3 benchmark.py

昇腾NPU上的单图延迟(运行10次,批次大小=1):

指标数值
输入形状[1, 3, 224, 224]
平均延迟17.33 ms
最小延迟16.83 ms
最大延迟17.72 ms
p50延迟17.61 ms
p90延迟17.66 ms
p95延迟17.69 ms
每秒图像数57.70

自我验证

Self-Verification

#NPU