timm/efficientnet_b5.sw_in12k_ft_in1k on Ascend NPU

1. 简介

本项目将 timm/efficientnet_b5.sw_in12k_ft_in1k 模型适配到昇腾 NPU (Ascend910) 上进行单图推理验证。

该模型为 EfficientNet-B5，在 ImageNet-12k 上预训练并在 ImageNet-1k 上微调，输入分辨率为 448x448，输出 1000 类分类结果。

适配要点：

使用 ModelScope snapshot_download 下载权重，避免 HuggingFace 自动下载
使用 timm.create_model(..., pretrained=False) + 本地权重加载
使用 timm.data.resolve_model_data_config 自动解析预处理配置
单卡 NPU (npu:0) 真实推理验证

2. 验证环境

项目	版本
NPU	Ascend910
CANN	8.5.1
PyTorch	2.x
torch_npu	适配 CANN 8.5.1
timm	latest
modelscope	latest

环境检查日志：logs/env_check.log

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

Top-1: class_984 (0.472293)
Top-2: class_138 (0.022324)
Top-3: class_998 (0.012309)
Top-4: class_353 (0.010512)
Top-5: class_975 (0.009882)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.019810
mean_abs_error	0.011801
relative_error	0.3250%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_984
NPU Top-1: class_984
CPU Top-5: class_984, class_138, class_998, class_353, class_975
NPU Top-5: class_984, class_138, class_998, class_353, class_975
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
avg_latency_ms	19.894
min_latency_ms	19.443
max_latency_ms	20.703
p50_latency_ms	19.790
p90_latency_ms	20.383
p95_latency_ms	20.543
images_per_sec	50.27

测试配置：单卡 Ascend910，batch_size=1，输入尺寸 448x448，预热 2 次，正式测试 10 次取平均。

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

日志	路径
推理日志	`logs/inference.log`
精度验证	`logs/accuracy.log`
性能基准	`logs/benchmark.log`
环境检查	`logs/env_check.log`

9. 注意事项

权重通过 ModelScope 下载，首次运行需联网；后续会从本地缓存加载
该模型输入尺寸为 448x448（非 224x224），由 timm.data.resolve_model_data_config 自动解析
模型未提供 id2label 映射，推理结果以 class_{index} 形式展示
禁止将权重文件（*.bin, *.safetensors, *.pth 等）提交到 Git 仓库

10. 标签

#NPU #Ascend #Ascend910 #EfficientNet #ImageNet

1. 简介

本项目将 timm/efficientnet_b5.sw_in12k_ft_in1k 模型适配到昇腾 NPU (Ascend910) 上进行单图推理验证。

该模型为 EfficientNet-B5，在 ImageNet-12k 上预训练并在 ImageNet-1k 上微调，输入分辨率为 448x448，输出 1000 类分类结果。

适配要点：

使用 ModelScope snapshot_download 下载权重，避免 HuggingFace 自动下载

使用 timm.create_model(..., pretrained=False) + 本地权重加载

使用 timm.data.resolve_model_data_config 自动解析预处理配置

单卡 NPU (npu:0) 真实推理验证

项目

版本

NPU

Ascend910

CANN

8.5.1

PyTorch

2.x

torch_npu

适配 CANN 8.5.1

timm

latest

modelscope

latest

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.019810
mean_abs_error	0.011801
relative_error	0.3250%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_984

NPU Top-1: class_984

CPU Top-5: class_984, class_138, class_998, class_353, class_975

NPU Top-5: class_984, class_138, class_998, class_353, class_975

Top-1 match: True

Top-5 match: True

指标

数值

avg_latency_ms

19.894

min_latency_ms

19.443

max_latency_ms

20.703

p50_latency_ms

19.790

p90_latency_ms

20.383

p95_latency_ms

20.543

images_per_sec

50.27

日志

路径

推理日志

logs/inference.log

精度验证

logs/accuracy.log

性能基准

logs/benchmark.log

环境检查

logs/env_check.log

9. 注意事项

权重通过 ModelScope 下载，首次运行需联网；后续会从本地缓存加载

该模型输入尺寸为 448x448（非 224x224），由 timm.data.resolve_model_data_config 自动解析

模型未提供 id2label 映射，推理结果以 class_{index} 形式展示

禁止将权重文件（*.bin, *.safetensors, *.pth 等）提交到 Git 仓库