timm/rexnet_300.nav_in1k on Ascend NPU

1. 简介

本项目将 timm 框架中的 ReXNet-300 (rexnet_300.nav_in1k) 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重，timm.create_model(pretrained=False) 加载本地权重，包含推理验证、CPU-NPU 精度一致性检查和性能基准测试。

模型类型：图片分类
模型参数：ReXNet-300 (ReXNet eXtended, 300 width multiplier)
训练数据集：ImageNet-1K
模型来源：ModelScope (timm/rexnet_300.nav_in1k)

2. 验证环境

项目	信息
硬件	华为昇腾 910 (Ascend910)
NPU 数量	单卡
HBM 容量	65536 MB
框架	PyTorch + torch_npu
操作系统	Linux

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理结果 (单张测试图片):

Top-1: class_977 (0.4181)
Top-5: class_977 (0.4181), class_978 (0.2053), class_976 (0.0307), class_975 (0.0180), class_437 (0.0059)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.018099
mean_abs_error	0.003114
relative_error	0.7534%
cosine_similarity	0.999982
threshold	1.0%
结果	PASS

CPU Top-1: class_977
NPU Top-1: class_977
CPU Top-5: class_977, class_978, class_976, class_975, class_437
NPU Top-5: class_977, class_978, class_976, class_975, class_437
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
平均延迟	8.55 ms
最小延迟	8.46 ms
最大延迟	8.75 ms
P50	8.54 ms
P90	8.75 ms
P95	8.75 ms
吞吐量	116.96 images/sec

测试条件：batch_size=1, 单卡 Ascend910, 预热 2 次 + 正式 10 次

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

CPU-NPU 精度一致性验证通过，relative_error=0.7534% < 1.0% 阈值，Top-1/Top-5 完全匹配。

7. 自验证截图

详见 screenshots/self_verification.txt

8. 日志文件

文件	说明
logs/inference.log	推理结果
logs/accuracy.log	精度验证结果
logs/benchmark.log	性能基准测试结果
logs/env_check.log	NPU 环境检查

9. 注意事项

使用 ModelScope snapshot_download 作为主下载方式，不使用 HuggingFace 直连
使用 timm.create_model(pretrained=False) 加载本地权重
不提交模型权重文件（*.bin, *.safetensors, *.pth, *.pt, *.ckpt, *.onnx）
适配基于单卡昇腾 NPU，不涉及分布式训练

10. 标签

#NPU #Ascend #Ascend910 #timm #ReXNet #图片分类 #ImageNet

1. 简介

模型类型：图片分类

模型参数：ReXNet-300 (ReXNet eXtended, 300 width multiplier)

训练数据集：ImageNet-1K

模型来源：ModelScope (timm/rexnet_300.nav_in1k)

项目

信息

硬件

华为昇腾 910 (Ascend910)

NPU 数量

单卡

HBM 容量

65536 MB

框架

PyTorch + torch_npu

操作系统

Linux

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.018099
mean_abs_error	0.003114
relative_error	0.7534%
cosine_similarity	0.999982
threshold	1.0%
结果	PASS

CPU Top-1: class_977

NPU Top-1: class_977

CPU Top-5: class_977, class_978, class_976, class_975, class_437

NPU Top-5: class_977, class_978, class_976, class_975, class_437

Top-1 match: True

Top-5 match: True

指标

数值

平均延迟

8.55 ms

最小延迟

8.46 ms

最大延迟

8.75 ms

P50

8.54 ms

P90

8.75 ms

P95

8.75 ms

吞吐量

116.96 images/sec

文件

说明

logs/inference.log

推理结果

logs/accuracy.log

精度验证结果

logs/benchmark.log

性能基准测试结果

logs/env_check.log

NPU 环境检查