timm/convnext_base.fb_in22k on Ascend NPU

1. 简介

本项目将 timm/convnext_base.fb_in22k 适配到昇腾 NPU (Ascend910) 上运行，支持单卡推理、CPU-NPU 精度一致性检查和性能基准测试。

模型类型：Image Classification
模型架构：ConvNeXt Base (Facebook AI, ImageNet-22k pretraining)
输出类别数：21841
输入尺寸：224x224

2. 验证环境

NPU: Ascend910_9362
npu-smi: 25.5.2
Python: PyTorch + torch_npu
权重下载：ModelScope snapshot_download（主路径）

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 timm.create_model(pretrained=False) 创建模型结构，并通过 ModelScope 下载的本地权重进行加载，在 npu:0 上执行真实推理。

推理输出示例：

Model: timm/convnext_base.fb_in22k
Weights: /opt/atomgit/.cache/modelscope/hub/models/timm/convnext_base___fb_in22k/model.safetensors
Missing keys: 0, Unexpected keys: 0
Input shape: [1, 3, 224, 224]
Output shape: [1, 21841]
Top-5 predictions:
  1. class_6299: 0.096303
  2. class_10490: 0.087213
  3. class_10146: 0.082425
  4. class_4877: 0.055990
  5. class_5753: 0.036039

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.029718
mean_abs_error	0.004601
relative_error	0.6639%
cosine_similarity	0.999983
threshold	1.0%
结果	PASS

CPU Top-1 与 NPU Top-1 类别一致
CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

python benchmark.py

指标	数值
平均延迟	14.98 ms
P50 延迟	14.99 ms
P90 延迟	15.01 ms
吞吐量	66.74 images/sec

6. 精度评测

本仓库仅提供单图 smoke consistency 验证，非 ImageNet 官方精度。官方 ImageNet-22k 预训练权重，ImageNet-1k fine-tune 后 Top-1 约 85.8%（参考 timm 官方文档）。

7. 自验证截图

见 screenshots/self_verification.png 和 screenshots/self_verification.txt。

8. 日志文件

日志	说明
`logs/env_check.log`	NPU 环境信息
`logs/inference.log`	推理输出
`logs/accuracy.log`	CPU-NPU 一致性对比
`logs/benchmark.log`	性能基准测试结果

9. 注意事项

权重通过 ModelScope snapshot_download 下载，不随仓库提交
严禁使用 timm.create_model(..., pretrained=True) 触发 HuggingFace 直连下载
推理预处理使用 timm.data.resolve_model_data_config + create_transform，与训练时保持一致
若 NPU 不可用，脚本将报错退出

10. 标签

#NPU

1. 简介

本项目将 timm/convnext_base.fb_in22k 适配到昇腾 NPU (Ascend910) 上运行，支持单卡推理、CPU-NPU 精度一致性检查和性能基准测试。

模型类型：Image Classification

模型架构：ConvNeXt Base (Facebook AI, ImageNet-22k pretraining)

输出类别数：21841

输入尺寸：224x224

3. 推理运行

pip install -r requirements.txt
python inference.py

推理脚本使用 timm.create_model(pretrained=False) 创建模型结构，并通过 ModelScope 下载的本地权重进行加载，在 npu:0 上执行真实推理。

推理输出示例：

Model: timm/convnext_base.fb_in22k
Weights: /opt/atomgit/.cache/modelscope/hub/models/timm/convnext_base___fb_in22k/model.safetensors
Missing keys: 0, Unexpected keys: 0
Input shape: [1, 3, 224, 224]
Output shape: [1, 21841]
Top-5 predictions:
  1. class_6299: 0.096303
  2. class_10490: 0.087213
  3. class_10146: 0.082425
  4. class_4877: 0.055990
  5. class_5753: 0.036039

指标

数值

max_abs_error

0.029718

mean_abs_error

0.004601

relative_error

0.6639%

cosine_similarity

0.999983

threshold

1.0%

结果

PASS

指标

数值

平均延迟

14.98 ms

P50 延迟

14.99 ms

P90 延迟

15.01 ms

吞吐量

66.74 images/sec

日志

说明

logs/env_check.log

NPU 环境信息

logs/inference.log

推理输出

logs/accuracy.log

CPU-NPU 一致性对比

logs/benchmark.log

性能基准测试结果

9. 注意事项

权重通过 ModelScope snapshot_download 下载，不随仓库提交

严禁使用 timm.create_model(..., pretrained=True) 触发 HuggingFace 直连下载

推理预处理使用 timm.data.resolve_model_data_config + create_transform，与训练时保持一致

若 NPU 不可用，脚本将报错退出