RegNetY-4.0GF 是 Facebook AI Research (FAIR) 提出的 RegNet 系列图像分类模型。RegNet 通过设计空间搜索方法发现了高性能的网络结构,在计算效率和准确率之间取得了优秀的平衡。
| 属性 | 值 |
|---|---|
| 模型名称 | RegNetY-4.0GF |
| 原始模型地址 | ModelScope |
| 任务类型 | 图像分类 (Image Classification) |
| 模型框架 | PyTorch + HuggingFace Transformers |
| 参数量 | 20.6M |
| 输入格式 | 图像 (RGB, 224×224) |
| 输出格式 | 1000 类 ImageNet 分类概率 |
| 硬件环境 | 华为昇腾 Ascend 910 (NPU) |
该模型基于 HuggingFace Transformers 框架的 RegNetForImageClassification 实现。通过在昇腾 NPU 上运行推理,利用 Ascend 910 加速器实现高性能图像分类。
适配要点:
torch_npu 将模型加载到 NPU 设备pip install torch torchvision transformers pillow numpy -i https://mirrors.aliyun.com/pypi/simple/
# 确保昇腾 NPU 环境可用
python3 -c "import torch; print(torch.npu.is_available())"# NPU 推理
python3 inference.py --device npu
# CPU 推理
python3 inference.py --device cpu
# 精度对比
python3 compare_cpu_npu.py --num_images 5| 指标 | CPU | NPU | 加速比 |
|---|---|---|---|
| 平均推理耗时 | 214.0 ms | 45.1 ms | 4.75x |
RegNetY-4.0GF 在 Ascend 910 NPU 上的推理速度达到 CPU 的 4.75倍,展现了昇腾 NPU 在图像分类任务上的高性能优势。
使用 5 张随机测试图片,在相同输入下对比 CPU 与 NPU 的推理输出:
| 测试图片 | Top-1 一致 | Logits 最大绝对误差 | Cosine 相似度 |
|---|---|---|---|
| 1 | ✓ | 0.004444 | 0.99999988 |
| 2 | ✓ | 0.003671 | 0.99999988 |
| 3 | ✓ | 0.003669 | 0.99999988 |
| 4 | ✓ | 0.003512 | 1.00000000 |
| 5 | ✓ | 0.003260 | 0.99999988 |
| 指标 | 值 |
|---|---|
| Top-1 预测一致率 | 100.0% |
| Logits 平均最大绝对误差 | 0.00371138 |
| 概率平均最大绝对误差 | 0.00013772 |
| Cosine 相似度 | 0.9999999046 |
| 平均相对误差 | 0.2967% |
NPU 与 CPU 推理结果误差 < 1%,精度完全满足要求。
所有测试图片的 Top-1 预测结果完全一致(100%),输出向量的 Cosine 相似度接近 1.0,最大概率误差小于 0.05%,证明 NPU 推理结果与 CPU 推理结果在数值上高度一致。

在执行 compare_cpu_npu.py 后可以看到类似以下关键日志:
============================================================
RegNet CPU vs NPU 精度对比
模型: facebook/regnet-y-040
============================================================
============================== CPU 推理 ==============================
CPU 平均耗时: 214.0 ms
============================== NPU 推理 ==============================
NPU 平均耗时: 45.1 ms
======================================================================
精度对比汇总
======================================================================
平均 Top-1 一致率: 100.00%
平均余弦相似度: 0.99999990
平均相对误差: 0.2967%
NPU 加速比: 4.75x
结论: NPU 与 CPU 推理结果误差 < 1%
======================================================================#+NPU #+CV #+昇腾 #+Ascend #+图像分类 #+RegNet #+PyTorch #+Transformers