e
gcw_GSiqzzLf/fbnetv3_b.ra2_in1k-npu
模型介绍文件和版本Pull Requests讨论分析

fbnetv3_b.ra2_in1k NPU 推理适配

模型介绍

FBNetV3-B 是 Facebook 提出的 FBNetV3 系列神经网络架构搜索模型。FBNetV3 通过改进的 NAS 搜索策略,在 MobileNetV3 的基础上进一步优化了精度和效率的平衡。模型在 ImageNet-1k 数据集上训练。

  • 原始模型地址: https://huggingface.co/timm/fbnetv3_b.ra2_in1k
  • ModelScope 地址: https://www.modelscope.cn/models/timm/fbnetv3_b.ra2_in1k
  • 任务类型: 图像分类 (Image Classification)
  • 模型框架: PyTorch + timm

模型信息

属性值
架构类型MobileNetV3
输入尺寸224 × 224
类别数1000
预处理均值[0.485, 0.456, 0.406]
预处理标准差[0.229, 0.224, 0.225]

NPU 适配说明

此模型基于 torch_npu 在华为昇腾 NPU 上完成推理适配。模型权重通过 ModelScope 下载,加载到 timm 定义的模型结构中。CPU 和 NPU 推理结果对比验证精度满足要求。

环境准备

安装依赖

pip install -r requirements.txt

推理命令

# CPU 推理
python3 inference.py --device cpu

# NPU 推理
python3 inference.py --device npu

推理结果

CPU 推理

Avg: 42.30 ms (10 runs)
Top-5 predictions:
  Class 21: 0.059189
  Class 127: 0.041761
  Class 128: 0.039383
  Class 111: 0.036534
  Class 23: 0.026842

NPU 推理

Avg: 10.84 ms (10 runs)
Top-5 predictions:
  Class 21: 0.058949
  Class 127: 0.041702
  Class 128: 0.039389
  Class 111: 0.036610
  Class 23: 0.026767

推理性能对比

设备平均推理耗时 (ms)加速比
CPU42.301.0×
NPU (Ascend910)10.843.9×

CPU/NPU 精度测试

精度测试结果

指标值
Logits 余弦相似度0.99999950
Probabilities 最大绝对误差0.00024012
Probabilities 平均绝对误差0.00000146
Top-1 类别一致率100.00%

Top-5 概率详细对比

RankCPU ClassCPU ProbNPU ClassNPU ProbProb Diff
1210.05918923210.058949100.00024012
21270.041760651270.041701770.00005889
31280.039383281280.039388780.00000550
41110.036534101110.036609830.00007573
5230.02684228230.026767080.00007520

精度测试结论

NPU 与 CPU 推理误差为 0.02%(概率最大绝对误差),符合精度误差小于 1% 的要求。

推理截图

推理截图

推理成功证据

以下日志展示了 NPU 推理成功的关键信息:

CPU Top-1: class 21, prob 0.059189
NPU Top-1: class 21, prob 0.058949
Top-1 agree: 100.00%
Top-5 detail:

模型标签

  • #+NPU
  • #+CV
  • #+图像分类
  • #+昇腾
  • #+FBNetV3
  • #+MobileNetV3
下载使用量0