g
gyccc/facebook-regnet-x-320-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/regnetx_032.pycls_in1k on Ascend NPU

1. 简介

本文档记录了 timm/regnetx_032.pycls_in1k 模型在华为昇腾 NPU (Ascend910) 上的适配过程和验证结果。

RegNet-X 320 是 Meta 提出的基于规则的网络架构,通过设计空间搜索得到的高效卷积神经网络。X 变体使用标准卷积操作。032 是该系列中的一个变体,在 ImageNet 上进行图像分类预训练。

2. 验证环境

  • 硬件: 华为昇腾 910 NPU
  • 软件: CANN 8.5.1, PyTorch 2.x, torch_npu
  • 操作系统: Linux (aarch64)
  • 模型来源: ModelScope (timm/regnetx_032.pycls_in1k)
  • 权重格式: model.safetensors
  • 模型加载方式: timm.create_model(pretrained=False) + 本地权重

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_743 (0.9184)
  • Top-2: class_449 (0.0059)
  • Top-3: class_468 (0.0055)
  • Top-4: class_483 (0.0050)
  • Top-5: class_718 (0.0049)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.008419
mean_abs_error0.001747
relative_error0.0839%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1: class_743
  • NPU Top-1: class_743
  • CPU Top-5: class_743, class_449, class_468, class_483, class_718
  • NPU Top-5: class_743, class_449, class_468, class_483, class_718
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
avg_latency8.91 ms
min_latency8.54 ms
max_latency9.45 ms
p50_latency9.00 ms
p90_latency9.16 ms
p95_latency9.31 ms
throughput112.20 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png 和 screenshots/self_verification.txt。

8. 日志文件

  • logs/env_check.log - NPU 环境检查
  • logs/inference.log - 推理结果
  • logs/accuracy.log - 精度验证
  • logs/benchmark.log - 性能测试

9. 注意事项

  1. 本适配使用 ModelScope snapshot_download 下载权重,避免直接从 HuggingFace 下载
  2. 模型使用 timm.create_model(pretrained=False) 加载,通过本地权重文件恢复参数
  3. 精度验证采用单图 smoke test,非完整 ImageNet 验证集评测
  4. NPU 推理结果与 CPU 结果高度一致,相对误差 0.0839% < 1.0%
  5. CPU-NPU Top-1 和 Top-5 预测完全匹配,cosine_similarity = 1.000000

10. 标签

#NPU #Ascend #Ascend910 #RegNet #ImageClassification #timm