timm/resnext50_32x4d.a1_in1k on Ascend NPU

1. 简介

本项目将 timm/resnext50_32x4d.a1_in1k 图片分类模型适配到单卡昇腾 NPU（Ascend910），支持真实 NPU 推理、CPU-NPU 精度一致性对比和性能基准测试。

模型来源：ModelScope
模型类型：timm 图片分类
输入尺寸：1x3x224x224
输出维度：1000 类 logits
加载方式：timm.create_model(pretrained=False) + ModelScope 本地权重加载

2. 验证环境

NPU: Ascend910
npu-smi: 25.5.2
PyTorch + torch_npu

环境详情见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

Top-1: class_637 (0.2760)
Top-2: class_707 (0.2614)
Top-3: class_480 (0.0792)
Top-4: class_369 (0.0357)
Top-5: class_571 (0.0279)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

推理结果（单张测试图片）：

Top-1 class: class_701
Top-1 prob: 0.0146
Top-5: class_701 (0.0146), class_405 (0.0121), class_21 (0.0113), class_783 (0.0081), class_644 (0.0080) 对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.014154
mean_abs_error	0.002434
relative_error	0.0248%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

5. 性能参考

python benchmark.py

指标	数值
Avg latency	5.90 ms
Min latency	5.79 ms
Max latency	6.03 ms
P50 latency	5.89 ms
P90 latency	5.95 ms
P95 latency	5.99 ms
Throughput	169.61 images/sec

6. 精度评测

本项目仅提供 Smoke 一致性验证（单张随机图片 CPU vs NPU），非官方 ImageNet 验证集精度。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

logs/env_check.log
logs/inference.log
logs/accuracy.log
logs/benchmark.log
logs/paths.txt

9. 注意事项

权重通过 ModelScope snapshot_download 下载到本地缓存，运行时动态加载。
请勿将 .bin / .safetensors / .pth / .pt / .ckpt / .onnx 提交到仓库。
推理前请确保 NPU 驱动和 torch_npu 已正确安装。

10. 标签

#NPU #Ascend #timm #image-classification

1. 简介

本项目将 timm/resnext50_32x4d.a1_in1k 图片分类模型适配到单卡昇腾 NPU（Ascend910），支持真实 NPU 推理、CPU-NPU 精度一致性对比和性能基准测试。

模型来源：ModelScope

模型类型：timm 图片分类

输入尺寸：1x3x224x224

输出维度：1000 类 logits

加载方式：timm.create_model(pretrained=False) + ModelScope 本地权重加载

4. 精度验证

python eval_accuracy.py

推理结果（单张测试图片）：

Top-1 class: class_701

Top-1 prob: 0.0146

Top-5: class_701 (0.0146), class_405 (0.0121), class_21 (0.0113), class_783 (0.0081), class_644 (0.0080) 对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.014154
mean_abs_error	0.002434
relative_error	0.0248%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

指标

数值

Avg latency

5.90 ms

Min latency

5.79 ms

Max latency

6.03 ms

P50 latency

5.89 ms

P90 latency

5.95 ms

P95 latency

5.99 ms

Throughput

169.61 images/sec