timm/efficientnet_b4.ra2_in1k on Ascend NPU

1. 简介

将 timm EfficientNet-B4 (ra2_in1k 变体) 图片分类模型适配到华为昇腾 NPU (Ascend910)。

模型来源：timm/efficientnet_b4.ra2_in1k（ModelScope）
模型参数量：约 19M
输入尺寸：224x224 RGB
输出类别数：1000（ImageNet）
下载方式：ModelScope snapshot_download + timm.create_model(pretrained=False) 本地权重加载

2. 验证环境

项目	值
设备	Ascend910
PyTorch	torch + torch_npu
模型加载	`pretrained=False` + 本地 safetensors
验证日期	2026-05-12

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

Top-1: class_403 (0.2122)
Top-2: class_554 (0.0614)
Top-3: class_540 (0.0472)
Top-4: class_628 (0.0424)
Top-5: class_405 (0.0392)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.004847
mean_abs_error	0.001143
relative_error	0.1104%
cosine_similarity	0.999999
threshold	1.0%
结果	PASS

CPU Top-1 与 NPU Top-1 类别一致
CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标	值
平均延迟	19.29 ms
最小延迟	15.05 ms
最大延迟	42.08 ms
P50	15.55 ms
P90	25.16 ms
P95	33.62 ms
吞吐量	51.85 images/sec

6. 精度评测

本次为 Smoke 一致性验证，非官方精度评测。Top-1/Top-5 在 CPU 与 NPU 间完全匹配。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件	说明
`logs/env_check.log`	NPU 环境检查
`logs/inference.log`	推理结果
`logs/accuracy.log`	精度验证
`logs/benchmark.log`	性能基准

9. 注意事项

使用 ModelScope snapshot_download 下载模型权重，不依赖 HuggingFace 直连
timm.create_model(pretrained=False) 创建结构，手动加载本地权重
未提交任何权重文件（.safetensors / .bin 等已在 .gitignore 中排除）
Smoke 验证仅验证 CPU-NPU 一致性，不代表最终 ImageNet 精度

10. 标签

#NPU #Ascend910 #image-classification #timm #efficientnet

1. 简介

将 timm EfficientNet-B4 (ra2_in1k 变体) 图片分类模型适配到华为昇腾 NPU (Ascend910)。

模型来源：timm/efficientnet_b4.ra2_in1k（ModelScope）

模型参数量：约 19M

输入尺寸：224x224 RGB

输出类别数：1000（ImageNet）

下载方式：ModelScope snapshot_download + timm.create_model(pretrained=False) 本地权重加载

项目

值

设备

Ascend910

PyTorch

torch + torch_npu

模型加载

pretrained=False + 本地 safetensors

验证日期

2026-05-12

指标

数值

max_abs_error

0.004847

mean_abs_error

0.001143

relative_error

0.1104%

cosine_similarity

0.999999

threshold

1.0%

结果

PASS

指标

值

平均延迟

19.29 ms

最小延迟

15.05 ms

最大延迟

42.08 ms

P50

15.55 ms

P90

25.16 ms

P95

33.62 ms

吞吐量

51.85 images/sec

文件

说明

logs/env_check.log

NPU 环境检查

logs/inference.log

推理结果

logs/accuracy.log

精度验证

logs/benchmark.log

性能基准

9. 注意事项

使用 ModelScope snapshot_download 下载模型权重，不依赖 HuggingFace 直连

timm.create_model(pretrained=False) 创建结构，手动加载本地权重

未提交任何权重文件（.safetensors / .bin 等已在 .gitignore 中排除）

Smoke 验证仅验证 CPU-NPU 一致性，不代表最终 ImageNet 精度