timm/convnext_tiny.fb_in22k_ft_in1k on Ascend NPU

1. 简介

将 timm/convnext_tiny.fb_in22k_ft_in1k（ConvNeXt-Tiny，ImageNet-22k 预训练后微调至 ImageNet-1K）适配为可在单卡昇腾 NPU（Ascend910B）上运行的提交工程。

模型类型：图像分类（ConvNeXt）
参数量：28.6M
输入：1x3x224x224
输出：1x1000（ImageNet-1K 类别）
权重来源：ModelScope snapshot_download + timm.create_model(pretrained=False)

2. 验证环境

硬件：Ascend910B（HBM 64GB）
OS：Linux 5.10.0 (aarch64)
Python：3.x
PyTorch + torch_npu
npu-smi：NPU 0 状态 OK
Device：Ascend910_9362

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本通过 ModelScope snapshot_download 下载模型，使用 timm.create_model(pretrained=False) 创建结构并加载本地 safetensors 权重，在 npu:0 上执行推理，输出 Top-5 预测结果。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.017811
mean_abs_error	0.003295
relative_error	0.4815%
cosine_similarity	0.999991
threshold	1.0%
结果	PASS

CPU Top-1 与 NPU Top-1 类别一致
CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标	值
平均延迟	6.73 ms
最小延迟	6.69 ms
最大延迟	6.87 ms
P50	6.72 ms
P90	6.87 ms
P95	6.87 ms
吞吐量	148.58 images/sec

测试条件：batch=1, 224x224, warmup=2, runs=10

6. 精度评测

详见 logs/accuracy.log，为 smoke consistency 检查，非官方精度评测。

7. 自验证截图

见 screenshots/self_verification.png

8. 日志文件

logs/inference.log — 推理结果
logs/accuracy.log — 精度对比
logs/benchmark.log — 性能测试
logs/env_check.log — 环境检查

9. 注意事项

使用 ModelScope snapshot_download 作为主下载方式，不使用 HuggingFace 直连
timm.create_model(pretrained=False)，权重通过本地 safetensors 加载
不 fallback，不提交权重文件
精度验证为 smoke consistency，非官方 ImageNet 评测

10. 标签

#NPU

1. 简介

将 timm/convnext_tiny.fb_in22k_ft_in1k（ConvNeXt-Tiny，ImageNet-22k 预训练后微调至 ImageNet-1K）适配为可在单卡昇腾 NPU（Ascend910B）上运行的提交工程。

模型类型：图像分类（ConvNeXt）

参数量：28.6M

输入：1x3x224x224

输出：1x1000（ImageNet-1K 类别）

权重来源：ModelScope snapshot_download + timm.create_model(pretrained=False)

指标

数值

max_abs_error

0.017811

mean_abs_error

0.003295

relative_error

0.4815%

cosine_similarity

0.999991

threshold

1.0%

结果

PASS

指标

值

平均延迟

6.73 ms

最小延迟

6.69 ms

最大延迟

6.87 ms

P50

6.72 ms

P90

6.87 ms

P95

6.87 ms

吞吐量

148.58 images/sec