ConvNextV2-Tiny-22k-384 昇腾 NPU 部署指南

简介

ConvNextV2-Tiny 是 ConvNextV2 系列的 Tiny 级别图像分类模型，基于 ImageNet-22k 数据集预训练，并经过 384x384 分辨率微调。

验证环境

项目	版本
硬件	Atlas 800 A2
CANN	8.5.RC1
PyTorch	2.5.1
torch_npu	2.5.1
Python	3.10

推理

import torch
from transformers import AutoImageProcessor, ConvNextV2ForImageClassification
from PIL import Image

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model_path = "facebook/convnextv2-tiny-22k-384"

processor = AutoImageProcessor.from_pretrained(model_path)
model = ConvNextV2ForImageClassification.from_pretrained(model_path).to(device)
model.eval()

image = Image.open("test.jpg").convert("RGB")
inputs = processor(images=image, return_tensors="pt")
inputs = {k: v.to(device) for k, v in inputs.items()}

with torch.no_grad():
    outputs = model(**inputs)
predicted = outputs.logits.argmax(-1).item()
print(f"预测类别: {predicted}")

性能参考

指标	数值
平均推理时间	8.32 ms
输入尺寸	3x224x224
测试平台	Atlas 800 A2

精度评测

NPU vs CPU 精度对比（CPU 为基线，NPU 为验证目标）：

指标	数值
测试用例数	4
最大 logits 差异	0.011621
Top-1 一致性	4/4
平均 KL 散度	0.000005
精度要求	Top-1 100% + KL 散度 < 0.01
精度结论	一致 (PASS)

精度评测源代码和日志详见 eval/ 目录。

注意事项

必须从 facebook/ 命名空间下载 PyTorch 权重
Xenova/ 命名空间为 ONNX 格式，不兼容 PyTorch 推理

ConvNextV2-Tiny-22k-384 昇腾 NPU 部署指南

简介

ConvNextV2-Tiny 是 ConvNextV2 系列的 Tiny 级别图像分类模型，基于 ImageNet-22k 数据集预训练，并经过 384x384 分辨率微调。

验证环境

项目	版本
硬件	Atlas 800 A2
CANN	8.5.RC1
PyTorch	2.5.1
torch_npu	2.5.1
Python	3.10

推理

import torch
from transformers import AutoImageProcessor, ConvNextV2ForImageClassification
from PIL import Image

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model_path = "facebook/convnextv2-tiny-22k-384"

processor = AutoImageProcessor.from_pretrained(model_path)
model = ConvNextV2ForImageClassification.from_pretrained(model_path).to(device)
model.eval()

image = Image.open("test.jpg").convert("RGB")
inputs = processor(images=image, return_tensors="pt")
inputs = {k: v.to(device) for k, v in inputs.items()}

with torch.no_grad():
    outputs = model(**inputs)
predicted = outputs.logits.argmax(-1).item()
print(f"预测类别: {predicted}")

性能参考

指标	数值
平均推理时间	8.32 ms
输入尺寸	3x224x224
测试平台	Atlas 800 A2

精度评测

NPU vs CPU 精度对比（CPU 为基线，NPU 为验证目标）：

指标	数值
测试用例数	4
最大 logits 差异	0.011621
Top-1 一致性	4/4
平均 KL 散度	0.000005
精度要求	Top-1 100% + KL 散度 < 0.01
精度结论	一致 (PASS)

精度评测源代码和日志详见 eval/ 目录。

注意事项

必须从 facebook/ 命名空间下载 PyTorch 权重
Xenova/ 命名空间为 ONNX 格式，不兼容 PyTorch 推理