g
gyccc/timm-mobilenetv3_large_100.miil_in21k_ft_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析

timm/mobilenetv3_large_100.miil_in21k_ft_in1k on Ascend NPU #NPU

1. 简介

将 timm 预训练图片分类模型 mobilenetv3_large_100.miil_in21k_ft_in1k(MobileNetV3-Large,ImageNet-21k 预训练后微调至 ImageNet-1k,1000 类)适配至华为昇腾 NPU(Ascend910B),实现单卡推理。

  • 模型来源:ModelScope timm/mobilenetv3_large_100.miil_in21k_ft_in1k
  • 模型结构:timm MobileNetV3-Large,pretrained=False + 本地权重加载
  • 权重格式:safetensors(~21 MB)
  • 输出维度:[batch, 1000]

2. 验证环境

项目值
NPU 型号Ascend910B
npu-smi 版本25.5.2
PyTorch2.x + torch_npu
Python3.11
关键依赖timm, modelscope, safetensors

详见 logs/env_check.log。

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: class_757 (0.8882)
  • Top-2: class_654 (0.0578)
  • Top-3: class_609 (0.0191)
  • Top-4: class_660 (0.0127)
  • Top-5: class_915 (0.0046)

日志保存在 logs/inference.log。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.016199
mean_abs_error0.004038
relative_error0.1519%
cosine_similarity0.999999
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标值
平均延迟5.68 ms
最小延迟5.61 ms
最大延迟5.79 ms
P505.68 ms
P905.79 ms
P955.79 ms
吞吐量176.13 images/sec
测试次数10(预热 2 次)
输入 shape[1, 3, 224, 224]

6. 精度评测

Smoke consistency check 结果见第 4 节。CPU 与 NPU 输出 Top-1/Top-5 完全一致,logit 和概率差异在浮点误差范围内。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件说明
logs/env_check.logNPU 环境信息
logs/paths.txt模型路径记录
logs/inference.log推理输出
logs/accuracy.log精度验证
logs/benchmark.log性能测试

9. 注意事项

  • 权重通过 ModelScope 下载,未使用 HuggingFace 直连
  • *.safetensors、*.bin 等权重文件已通过 .gitignore 排除,不提交至仓库
  • 模型输出为 ImageNet 类别索引(class_0 ~ class_999),无 id2label 映射

10. 标签

#NPU

下载使用量0