convnext-base-garbage

1. 简介

本文档记录 iic/cv_convnext-base_image-classification_garbage 在昇腾 NPU（Ascend910）环境的快速部署与验证结果。

本模型使用 OpenMMLab（mmcls）训练，非 HuggingFace 格式。推理需使用自定义 PyTorch ConvNeXt 实现加载 pytorch_model.pt 权重。

2. 验证环境

组件	版本
`torch`	`2.5.1`
`torch_npu`	`2.5.1`
`CANN`	`8.5.RC1`

NPU：Ascend910（单卡）
输入尺寸：3x224x224
类别数：265
架构：ConvNeXt-Base（垃圾分类，265 类）

3. 快速部署

3.1 环境准备

pip install torch torchvision pillow

3.2 推理代码

import torch
from PIL import Image
from torchvision import transforms

# 完整 ConvNeXt 定义见 inference.py
from inference import GarbageClassifier

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model = GarbageClassifier(num_classes=265)

ckpt = torch.load("pytorch_model.pt", map_location="cpu")
model.load_state_dict(ckpt["state_dict"], strict=True)
model = model.to(device).eval()

transform = transforms.Compose([
    transforms.Resize(256, interpolation=transforms.InterpolationMode.BICUBIC),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

img = Image.new("RGB", (224, 224), (128, 128, 128))
tensor = transform(img).unsqueeze(0).to(device)

with torch.no_grad():
    output = model(tensor)
pred = output.argmax(-1).item()
print(f"类别: {pred} (class name: {ckpt['meta']['CLASSES'][pred]})")

4. Smoke 验证

python3 inference.py

验证结果：

模型成功加载到 npu:0
输出预测类别
推理过程无报错

5. 性能参考

测试条件：FP32 / batch=1 / warmup=5 / timed=50 runs，Ascend910 单卡。

指标	数值
平均推理时间	`14.73ms`
测试次数	`50`

6. 精度评测

NPU 与 CPU 输出对比，使用 4 张纯色测试图，比较 logits 一致性。

指标	数值
Top-1 一致性	`4/4`
Top-5 一致性	`4/4`
最大 logits 差异	`0.030252`
平均 KL 散度	`3.1e-05`
结论	`PASS`

7. 注意事项

本模型非 HuggingFace transformers 标准格式，需使用特定推理脚本
NPU 推理结果与 CPU 在 Top-1/Top-5 完全一致

1. 简介

本文档记录 iic/cv_convnext-base_image-classification_garbage 在昇腾 NPU（Ascend910）环境的快速部署与验证结果。

本模型使用 OpenMMLab（mmcls）训练，非 HuggingFace 格式。推理需使用自定义 PyTorch ConvNeXt 实现加载 pytorch_model.pt 权重。

相关获取地址：

组件

版本

torch

2.5.1

torch_npu

2.5.1

CANN

8.5.RC1

3. 快速部署

3.1 环境准备

pip install torch torchvision pillow

3.2 推理代码

import torch
from PIL import Image
from torchvision import transforms

# 完整 ConvNeXt 定义见 inference.py
from inference import GarbageClassifier

device = torch.device("npu:0" if torch.npu.is_available() else "cpu")
model = GarbageClassifier(num_classes=265)

ckpt = torch.load("pytorch_model.pt", map_location="cpu")
model.load_state_dict(ckpt["state_dict"], strict=True)
model = model.to(device).eval()

transform = transforms.Compose([
    transforms.Resize(256, interpolation=transforms.InterpolationMode.BICUBIC),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

img = Image.new("RGB", (224, 224), (128, 128, 128))
tensor = transform(img).unsqueeze(0).to(device)

with torch.no_grad():
    output = model(tensor)
pred = output.argmax(-1).item()
print(f"类别: {pred} (class name: {ckpt['meta']['CLASSES'][pred]})")

指标

数值

平均推理时间

14.73ms

测试次数

50

指标

数值

Top-1 一致性

4/4

Top-5 一致性

4/4

最大 logits 差异

0.030252

平均 KL 散度

3.1e-05

结论

PASS