g
gcw_C8PI9e90/convnext-nano-in12k-ft-in1k-npu
模型介绍文件和版本Pull Requests讨论分析

convnext_nano.in12k_ft_in1k NPU 部署与推理

模型介绍

convnext_nano.in12k_ft_in1k 是 ConvNeXt 系列中的 Nano 版本,在 ImageNet-12k 上预训练后在 ImageNet-1k 上微调,适用于图像分类任务。

NPU 适配说明

本模型已适配昇腾 Ascend 910 NPU,支持在 NPU 上进行推理。

环境准备

系统要求

  • Python 3.11+
  • Ascend 910 NPU
  • CANN 8.5.1+
  • torch 2.0+
  • torch-npu 2.0+

安装依赖

pip install torch torch-npu timm Pillow safetensors

推理方法

# CPU 推理
python3 inference.py --model convnext_nano.in12k_ft_in1k --device cpu --image test.jpg

# NPU 推理
python3 inference.py --model convnext_nano.in12k_ft_in1k --device npu --image test.jpg

CPU/NPU 精度对比

精度测试结果

指标值
余弦相似度0.9999861717
平均相对误差0.327227%
MAE0.0049269744
MSE4.30331e-05
最大绝对误差0.0290164948
Top-1 分类一致是
Top-5 重叠数5/5

精度结论

基于现有评测数据,CPU 与 NPU 的 余弦相似度 精度误差为 0.0014%,小于 1% 的精度要求。

性能对比

设备推理耗时
CPU0.1685 s
NPU0.0057 s
加速比29.77×

推理成功证据

本仓库提供完整的推理脚本,支持 CPU 和 NPU 双平台推理:

# NPU 推理
python3 inference.py --device npu

# CPU 推理
python3 inference.py --device cpu

推理完成后会输出推理结果和耗时,表明模型在 NPU 上推理成功。

下载使用量0