e
gcw_GSiqzzLf/fbnetv3_g.ra2_in1k-npu
模型介绍文件和版本Pull Requests讨论分析

fbnetv3_g.ra2_in1k NPU 推理适配

模型介绍

FBNetV3-G 是 Facebook FBNetV3 系列中最大的变体,拥有更多的参数量(66.9MB权重)。该模型通过 NAS 技术搜索高效 CNN 架构,在 ImageNet-1k 上训练,输入尺寸为 240×240,具有更强的特征表达能力。

  • 原始模型地址: https://huggingface.co/timm/fbnetv3_g.ra2_in1k
  • ModelScope 地址: https://www.modelscope.cn/models/timm/fbnetv3_g.ra2_in1k
  • 任务类型: 图像分类 (Image Classification)
  • 模型框架: PyTorch + timm

模型信息

属性值
架构类型MobileNetV3
输入尺寸240 × 240
类别数1000
预处理均值[0.485, 0.456, 0.406]
预处理标准差[0.229, 0.224, 0.225]
权重大小66.9 MB

NPU 适配说明

此模型基于 torch_npu 在华为昇腾 NPU 上完成推理适配。

环境准备

pip install -r requirements.txt

推理命令

python3 inference.py --device cpu
python3 inference.py --device npu

推理结果

CPU

Avg: 98.48 ms (10 runs)
Top-5: Class 21 (0.093090), Class 22 (0.070240), Class 92 (0.049339), Class 23 (0.042455), Class 127 (0.036419)

NPU

Avg: 13.24 ms (10 runs)
Top-5: Class 21 (0.093156), Class 22 (0.070271), Class 92 (0.049297), Class 23 (0.042413), Class 127 (0.036442)

性能对比

设备耗时 (ms)加速比
CPU98.481.0×
NPU13.247.4×

CPU/NPU 精度测试

精度测试结果

指标值
Logits 余弦相似度0.99999958
Probabilities 最大绝对误差0.00006682
Probabilities 平均绝对误差0.00000028
Top-1 类别一致率100.00%

精度测试结论

NPU 与 CPU 推理误差为 0.01%(概率最大绝对误差),符合精度误差小于 1% 的要求。

推理截图

推理截图

推理成功证据

以下日志展示了 NPU 推理成功的关键信息:

CPU Top-1: class 21, prob 0.093090
NPU Top-1: class 21, prob 0.093156
Top-1 agree: 100.00%
Top-5:

模型标签

  • #+NPU
  • #+CV
  • #+图像分类
  • #+昇腾
  • #+FBNetV3
下载使用量0