X
Xiaoxy510/mobilenetv3_rw.rmsp_in1k-ascend
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

MobileNetV3 RW RMSP on Ascend NPU

1. 简介

本文档记录 mobilenetv3_rw.rmsp_in1k 图像分类模型在 Ascend 910B3 NPU 上的适配与验证结果。

mobilenetv3_rw 是 Ross Wightman (rw) 使用 RMSProp 优化器训练的 MobileNetV3 变体,参数量约 5.5M,与 mobilenetv3_large_100 参数量相当但在不同训练配方下获得。

主要工作:

  • 在 Ascend NPU 上加载并运行 timm 格式的 MobileNetV3 模型
  • CPU 与 NPU 推理精度对比验证(相对误差 < 1%)
  • NPU 推理性能评测

相关获取地址:

  • 权重下载地址(ModelScope):https://modelscope.cn/models/timm/mobilenetv3_rw.rmsp_in1k
  • 权重下载地址(HuggingFace):https://huggingface.co/timm/mobilenetv3_rw.rmsp_in1k
  • 原始仓库:https://github.com/huggingface/pytorch-image-models

2. 验证环境

组件版本
torch2.8.0
torch-npu2.8.0.post4
timm1.0.27
transformers4.57.6
  • NPU:Ascend 910B3(8 逻辑卡)
  • 输入尺寸:3 x 224 x 224

3. 环境准备

3.1 安装依赖

pip install torch torchvision torch_npu -i https://repo.huaweicloud.com/repository/pypi/simple
pip install timm transformers pillow -i https://repo.huaweicloud.com/repository/pypi/simple

3.2 下载模型权重

from modelscope import snapshot_download
snapshot_download('timm/mobilenetv3_rw.rmsp_in1k', local_dir='./mobilenetv3_rw.rmsp_in1k')

4. 快速开始

# 单张图片推理
python inference.py --image /path/to/image.jpg --topk 5

# 批量推理
python inference.py --image_dir /path/to/images/

# URL 图片
python inference.py --image https://example.com/cat.jpg

5. 推理验证

python inference.py --model_path ./mobilenetv3_rw.rmsp_in1k --image test.jpg --device npu

模型加载正常,NPU 推理返回 top-5 分类结果。

6. 性能参考

测试条件:batch_size=32,200 样本,100 次基准迭代。

指标NPU (Ascend 910B3)CPU
平均延迟9.84 ms (bs=32)284.51 ms
单样本延迟5.68 ms284.51 ms
吞吐量3252.99 img/s3.52 img/s
加速比50.09x1x

7. 精度评测

使用 200 张随机输入图片进行 CPU vs NPU 对比。

指标数值
最大绝对误差8.81e-03
最大相对误差0.23%
平均相对误差0.16%
最小余弦相似度0.99999887
平均余弦相似度0.99999928
结论✓ 通过(相对误差 < 1%)

评测命令:

python eval.py --model_path ./mobilenetv3_rw.rmsp_in1k --num_images 200 --batch_size 32

8. 注意事项

  1. 模型从本地 pytorch_model.bin 加载,支持 safetensors 格式。
  2. 输入预处理使用 timm.data.create_transform 自动配置,无需手动设置。
  3. CPU 端该模型推理较慢(284ms/样本),NPU 加速效果显著(50x)。
  4. 当前精度评测使用随机输入,如需 ImageNet 验证集精度请替换为真实数据加载。