g
gyccc/facebook-regnet-y-120-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

facebook/regnet-y-120 on Ascend NPU

1. 简介

将 Facebook RegNet-Y-120MF 图片分类模型适配到华为昇腾 NPU (Ascend910)。RegNet-Y-120MF 是 RegNet 系列中 Y 变体的 120MF 参数量版本,具有分组卷积和 SE 模块,适用于 ImageNet-1K 图片分类任务。

  • 模型来源:ModelScope (facebook/regnet-y-120)
  • 参数量:约 12M
  • 输入尺寸:224x224
  • 输出类别数:1000 (ImageNet-1K)

2. 验证环境

项目信息
NPUAscend910
CANN8.5.1
PyTorch2.x
torch_npu已安装
Python3.11

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: desk (0.9830)
  • Top-2: desktop computer (0.0071)
  • Top-3: file, file cabinet, filing cabinet (0.0023)
  • Top-4: monitor (0.0015)
  • Top-5: library (0.0014)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.003325
mean_abs_error0.000702
relative_error0.1241%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1: 818 (desk)
  • NPU Top-1: 818 (desk)
  • CPU Top-5: [412, 549, 650, 811, 818]
  • NPU Top-5: [412, 549, 650, 811, 818]
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
Avg Latency9.42 ms
Min Latency9.33 ms
Max Latency9.66 ms
P50 Latency9.38 ms
P90 Latency9.52 ms
P95 Latency9.59 ms
Throughput106.19 images/sec

测试条件:batch_size=1, warmup=2, iterations=10, Ascend910 NPU。

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。CPU 与 NPU 在相同输入下进行推理对比,验证数值一致性。详细指标见第 4 节。

7. 自验证截图

截图保存在 screenshots/self_verification.png,包含 NPU 环境、推理结果、精度验证和性能测试摘要。

8. 日志文件

  • logs/env_check.log - NPU 环境检查
  • logs/inference.log - 推理结果
  • logs/accuracy.log - 精度验证
  • logs/benchmark.log - 性能基准

9. 注意事项

  • 使用 from_pretrained() 从 ModelScope 本地缓存加载模型权重
  • Processor 尺寸已校验,与模型 config 中的 image_size 一致
  • 推理使用 torch.npu.synchronize() 确保异步操作完成
  • 未提交任何模型权重文件 (*.bin, *.safetensors) 到 Git 仓库

10. 标签

#NPU #Ascend910 #RegNet #ImageClassification #Facebook