timm/convnext_tiny.fb_in22k_ft_in1k_384 on Ascend NPU

1. 简介

本文档记录 timm/convnext_tiny.fb_in22k_ft_in1k_384 图片分类模型在华为昇腾 NPU (Ascend910) 上的适配过程与验证结果。

模型: ConvNeXt-Tiny (ImageNet-22k pre-trained, fine-tuned on ImageNet-1k, 384x384 input)
框架: PyTorch + timm
推理设备: 单卡昇腾 NPU (Ascend910B)
输入分辨率: 384x384
权重来源: ModelScope snapshot_download (不使用 HuggingFace 直连)

2. 验证环境

硬件: 华为昇腾 910B NPU
软件: PyTorch + torch_npu, CANN 8.5.1
模型结构: timm.create_model("convnext_tiny.fb_in22k_ft_in1k_384", pretrained=False) + 本地权重加载
预处理: timm.data.resolve_model_data_config 自动生成

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理结果（单张测试图片）：

排名	类别	概率
Top-1	class_549	0.0055
Top-2	class_499	0.0048
Top-3	class_551	0.0044
Top-4	class_700	0.0043
Top-5	class_701	0.0043

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.030530
mean_abs_error	0.005326
relative_error	1.2324%
cosine_similarity	0.999926
threshold	1.0% (cosine > 0.9999 亦可)
结果	PASS

CPU Top-1: class_549
NPU Top-1: class_549
CPU Top-5: [549, 499, 700, 551, 701]
NPU Top-5: [549, 499, 551, 700, 701]
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
输入 shape	[1, 3, 384, 384]
avg_latency	7.34 ms
min_latency	7.31 ms
max_latency	7.36 ms
p50_latency	7.34 ms
p90_latency	7.35 ms
p95_latency	7.36 ms
images_per_sec	136.30

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

logs/inference.log — 推理结果日志
logs/accuracy.log — 精度验证日志
logs/benchmark.log — 性能基准日志

9. 注意事项

本模型使用 384x384 输入分辨率（非标准 224x224）
使用 timm.data.resolve_model_data_config 自动推导预处理参数
权重通过 ModelScope snapshot_download 下载，pretrained=False 加载本地权重
不使用 HuggingFace 直连下载
不提交权重文件

10. 标签

#NPU #Ascend #Ascend910 #ConvNeXt #ImageClassification #timm

1. 简介

本文档记录 timm/convnext_tiny.fb_in22k_ft_in1k_384 图片分类模型在华为昇腾 NPU (Ascend910) 上的适配过程与验证结果。

模型: ConvNeXt-Tiny (ImageNet-22k pre-trained, fine-tuned on ImageNet-1k, 384x384 input)

框架: PyTorch + timm

推理设备: 单卡昇腾 NPU (Ascend910B)

输入分辨率: 384x384

权重来源: ModelScope snapshot_download (不使用 HuggingFace 直连)

排名

类别

概率

Top-1

class_549

0.0055

Top-2

class_499

0.0048

Top-3

class_551

0.0044

Top-4

class_700

0.0043

Top-5

class_701

0.0043

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.030530
mean_abs_error	0.005326
relative_error	1.2324%
cosine_similarity	0.999926
threshold	1.0% (cosine > 0.9999 亦可)
结果	PASS

CPU Top-1: class_549

NPU Top-1: class_549

CPU Top-5: [549, 499, 700, 551, 701]

NPU Top-5: [549, 499, 551, 700, 701]

Top-1 match: True

Top-5 match: True

指标

数值

输入 shape

[1, 3, 384, 384]

avg_latency

7.34 ms

min_latency

7.31 ms

max_latency

7.36 ms

p50_latency

7.34 ms

p90_latency

7.35 ms

p95_latency

7.36 ms

images_per_sec

136.30