g
gyccc/timm-mobilenetv3_large_100.miil_in21k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/mobilenetv3_large_100.miil_in21k on Ascend NPU

1. 简介

将 timm 预训练视觉模型 mobilenetv3_large_100.miil_in21k(MobileNetV3 Large,ImageNet-22k 预训练,11221 类)适配到单卡昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重,不使用 HuggingFace 直连下载。

2. 验证环境

项目配置
NPUAscend910_9362 (单卡)
CANN8.5.1
PyTorch2.9.0+cpu
torch_npu可用
Python3.11
模型参数量18,576,133
权重大小71.0 MB (safetensors)
类别数11221 (ImageNet-22k)

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

输出示例:

Top-1: class_3569 (0.0994)
Top-2: class_2443 (0.0819)
Top-3: class_6794 (0.0794)
Top-4: class_2455 (0.0300)
Top-5: class_3507 (0.0283)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.048798
mean_abs_error0.009190
relative_error0.6134%
cosine_similarity0.999980
threshold1.0%
结果PASS
  • CPU Top-1: class_3569
  • NPU Top-1: class_3569
  • CPU Top-5: class_3569, class_2443, class_6794, class_2455, class_3507
  • NPU Top-5: class_3569, class_2443, class_6794, class_2455, class_3507
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
平均推理延迟6.16 ms
最小延迟6.04 ms
最大延迟6.32 ms
p506.15 ms
p906.32 ms
p956.32 ms
吞吐量162.35 images/sec

测试条件:batch=1, 224x224 输入, 2 次预热 + 10 次正式测试, Ascend910 单卡。

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log - 推理输出日志
  • logs/accuracy.log - CPU-NPU 精度一致性验证日志
  • logs/benchmark.log - 性能基准测试日志
  • logs/env_check.log - 环境检查日志

9. 注意事项

  • 使用 pretrained=False + 本地权重加载,不使用 HuggingFace 自动下载
  • 权重文件(.safetensors / .bin)不提交到仓库
  • 本验证为单图 smoke test,非 ImageNet 完整验证集评测
  • MobileNetV3 Large 为轻量级 CNN 架构,18.6M 参数,11221 类 ImageNet-22k 预训练

10. 标签

#NPU