ConvNextV2-Nano-1k-224 昇腾 NPU 部署指南

简介

ConvNextV2-Nano 是 ConvNextV2 系列轻量级图像分类模型，输入 3x224x224，基于 ImageNet-1k 数据集训练。适用于图像分类、视觉特征提取等任务。

验证环境

项目	版本
硬件	Atlas 800 A2
CANN	8.5.RC1
PyTorch	2.5.1
torch_npu	2.5.1
Python	3.10

推理

使用 transformers 库加载模型进行推理：

import torch
from transformers import AutoImageProcessor, ConvNextV2ForImageClassification
from PIL import Image

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model_path = "facebook/convnextv2-nano-1k-224"

processor = AutoImageProcessor.from_pretrained(model_path)
model = ConvNextV2ForImageClassification.from_pretrained(model_path).to(device)
model.eval()

image = Image.open("test.jpg").convert("RGB")
inputs = processor(images=image, return_tensors="pt")
inputs = {k: v.to(device) for k, v in inputs.items()}

with torch.no_grad():
    outputs = model(**inputs)

logits = outputs.logits
predicted = logits.argmax(-1).item()
print(f"预测类别: {predicted}")

性能参考

指标	数值
平均推理时间	5.29 ms
输入尺寸	3x224x224
测试平台	Atlas 800 A2
Batch Size	1

精度评测

Ascend NPU 精度评测

NPU vs CPU 精度对比（CPU 为基线，NPU 为验证目标）：

指标	数值
测试用例数	4
最大 logits 差异	0.071636
Top-1 一致性	4/4
平均 KL 散度	0.000051
精度要求	Top-1 100% + KL 散度 < 0.01
精度结论	一致 (PASS)

精度评测源代码和日志详见 eval/ 目录。

注意事项

必须使用 PyTorch 权重（从 facebook/ 命名空间下载）
Xenova/ 命名空间为 ONNX 格式，不兼容 PyTorch 推理
使用 torch.npu 将模型迁移到 NPU 设备

ConvNextV2-Nano-1k-224 昇腾 NPU 部署指南

简介

ConvNextV2-Nano 是 ConvNextV2 系列轻量级图像分类模型，输入 3x224x224，基于 ImageNet-1k 数据集训练。适用于图像分类、视觉特征提取等任务。

验证环境

项目	版本
硬件	Atlas 800 A2
CANN	8.5.RC1
PyTorch	2.5.1
torch_npu	2.5.1
Python	3.10

推理

使用 transformers 库加载模型进行推理：

import torch
from transformers import AutoImageProcessor, ConvNextV2ForImageClassification
from PIL import Image

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model_path = "facebook/convnextv2-nano-1k-224"

processor = AutoImageProcessor.from_pretrained(model_path)
model = ConvNextV2ForImageClassification.from_pretrained(model_path).to(device)
model.eval()

image = Image.open("test.jpg").convert("RGB")
inputs = processor(images=image, return_tensors="pt")
inputs = {k: v.to(device) for k, v in inputs.items()}

with torch.no_grad():
    outputs = model(**inputs)

logits = outputs.logits
predicted = logits.argmax(-1).item()
print(f"预测类别: {predicted}")

性能参考

指标	数值
平均推理时间	5.29 ms
输入尺寸	3x224x224
测试平台	Atlas 800 A2
Batch Size	1

精度评测

Ascend NPU 精度评测

NPU vs CPU 精度对比（CPU 为基线，NPU 为验证目标）：

指标	数值
测试用例数	4
最大 logits 差异	0.071636
Top-1 一致性	4/4
平均 KL 散度	0.000051
精度要求	Top-1 100% + KL 散度 < 0.01
精度结论	一致 (PASS)

精度评测源代码和日志详见 eval/ 目录。

注意事项

必须使用 PyTorch 权重（从 facebook/ 命名空间下载）
Xenova/ 命名空间为 ONNX 格式，不兼容 PyTorch 推理
使用 torch.npu 将模型迁移到 NPU 设备