g
gyccc/timm-rexnet_300-nav_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/rexnet_300.nav_in1k on Ascend NPU

1. 简介

本项目将 timm 框架中的 ReXNet-300 (rexnet_300.nav_in1k) 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重,包含推理验证、CPU-NPU 精度一致性检查和性能基准测试。

  • 模型类型:图片分类
  • 模型参数:ReXNet-300 (ReXNet eXtended, 300 width multiplier)
  • 训练数据集:ImageNet-1K
  • 模型来源:ModelScope (timm/rexnet_300.nav_in1k)

2. 验证环境

项目信息
硬件华为昇腾 910 (Ascend910)
NPU 数量单卡
HBM 容量65536 MB
框架PyTorch + torch_npu
操作系统Linux

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理结果 (单张测试图片):

  • Top-1: class_977 (0.4181)
  • Top-5: class_977 (0.4181), class_978 (0.2053), class_976 (0.0307), class_975 (0.0180), class_437 (0.0059)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.018099
mean_abs_error0.003114
relative_error0.7534%
cosine_similarity0.999982
threshold1.0%
结果PASS
  • CPU Top-1: class_977
  • NPU Top-1: class_977
  • CPU Top-5: class_977, class_978, class_976, class_975, class_437
  • NPU Top-5: class_977, class_978, class_976, class_975, class_437
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
平均延迟8.55 ms
最小延迟8.46 ms
最大延迟8.75 ms
P508.54 ms
P908.75 ms
P958.75 ms
吞吐量116.96 images/sec
  • 测试条件:batch_size=1, 单卡 Ascend910, 预热 2 次 + 正式 10 次

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

CPU-NPU 精度一致性验证通过,relative_error=0.7534% < 1.0% 阈值,Top-1/Top-5 完全匹配。

7. 自验证截图

详见 screenshots/self_verification.txt

8. 日志文件

文件说明
logs/inference.log推理结果
logs/accuracy.log精度验证结果
logs/benchmark.log性能基准测试结果
logs/env_check.logNPU 环境检查

9. 注意事项

  • 使用 ModelScope snapshot_download 作为主下载方式,不使用 HuggingFace 直连
  • 使用 timm.create_model(pretrained=False) 加载本地权重
  • 不提交模型权重文件(*.bin, *.safetensors, *.pth, *.pt, *.ckpt, *.onnx)
  • 适配基于单卡昇腾 NPU,不涉及分布式训练

10. 标签

#NPU #Ascend #Ascend910 #timm #ReXNet #图片分类 #ImageNet