g
gcw_C8PI9e90/regnet-npu-work
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

RegNet NPU Work - Ascend NPU 模型适配

此仓库包含7个RegNet系列模型在华为昇腾Ascend910 NPU上的适配、部署与精度验证。

模型列表

模型参数量NPU 延迟架构
RegNet-X-08039.6M10.7msRegNetX-8GF
RegNet-X-16054.3M12.5msRegNetX-16GF
RegNet-X-320107.8M21.5msRegNetX-32GF
RegNet-Y-12051.8M14.7msRegNetY-1.6GF
RegNet-Y-320145.0M25.1msRegNetY-32GF
RegNet-Y-320-SEER145.0M24.6msRegNetY-32GF
RegNet-Y-640-SEER302.8M39.8msRegNetY-128GF

验证结果

所有7个模型均通过精度验证:

  • CPU(FP32)与NPU(FP32)输出高度一致
  • 最大绝对误差 < 1e-2
  • 余弦相似度 > 0.999999
  • Top-1 一致率: 100%
  • NPU 加速比: 对比CPU提升 ~200倍

硬件环境

  • NPU: Ascend910(64GB HBM)
  • CPU: ARM 64-bit(192核)
  • PyTorch: 2.9.0 / torch_npu: 2.9.0.post1

标签: #NPU #Ascend #RegNet #ImageClassification #PyTorch #Ascend910 #FP32 #timm