g
gyccc/timm-mobilenetv4_hybrid_medium.ix_e550_r384_in1k-NPU
模型介绍文件和版本Pull Requests讨论分析

timm/mobilenetv4_hybrid_medium.ix_e550_r384_in1k on Ascend NPU #NPU

1. 简介

将 timm MobileNetV4 Hybrid Medium (ImageNet-1k 预训练, 384x384 输入) 适配为单卡昇腾 NPU 可运行的提交工程。

  • 模型来源:ModelScope timm/mobilenetv4_hybrid_medium.ix_e550_r384_in1k
  • 权重格式:safetensors (42.6 MB)
  • 输入分辨率:384x384(由 timm.data.resolve_model_data_config 自动获取)
  • 输出:1000 类 ImageNet logits
  • 适配方式:timm.create_model(pretrained=False) + 本地权重加载,零 HuggingFace 直连

2. 验证环境

  • 硬件:Ascend910B (单卡)
  • 驱动:npu-smi 25.5.2
  • 框架:PyTorch + torch_npu
  • 适配日期:2026-05-12

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理(自动从 ModelScope 下载权重)
python inference.py

推理输出 Top-5:

  • #1: class_975 (0.5312)
  • #2: class_979 (0.0519)
  • #3: class_970 (0.0484)
  • #4: class_976 (0.0424)
  • #5: class_797 (0.0293)

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.006346
mean_abs_error0.000779
relative_error0.0050%
cosine_similarity1.000000
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

python benchmark.py
指标值
输入[1, 3, 384, 384]
平均延迟12.45 ms
P5012.40 ms
P9012.60 ms
P9512.67 ms
吞吐量80.33 images/sec

6. 精度评测

本工程提供 smoke consistency 验证(CPU vs NPU 输出一致性),非官方 ImageNet 精度评测。

7. 自验证截图

参见 screenshots/self_verification.png

8. 日志文件

文件说明
logs/inference.log推理输出
logs/accuracy.log精度一致性
logs/benchmark.log性能基准

9. 注意事项

  • 输入分辨率 384x384 由 timm.data.resolve_model_data_config 自动解析,无需手写
  • 权重通过 ModelScope snapshot_download 下载,不使用 HuggingFace 直连
  • pretrained=False,完全本地加载
  • 不提交权重文件(safetensors/bin/pth/pt/ckpt/onnx)
  • 适配验证为 smoke consistency,非官方精度评测

10. 标签 #NPU

#NPU #Ascend910B #timm #MobileNetV4 #ImageClassification #ModelScope

下载使用量0