g
gyccc/timm-tf_mobilenetv3_small_100.in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/tf_mobilenetv3_small_100.in1k on Ascend NPU

1. 简介

将 timm 模型 tf_mobilenetv3_small_100.in1k(MobileNetV3-Small,ImageNet-1k 分类)适配为可在单卡华为昇腾 NPU(Ascend910)上运行的提交工程。

  • 模型来源:ModelScope (timm/tf_mobilenetv3_small_100.in1k)
  • 模型结构:timm.create_model("tf_mobilenetv3_small_100.in1k", pretrained=False)
  • 权重加载:ModelScope snapshot_download + 本地 safetensors 加载
  • 兼容性等级:A(timm/*,最佳)

2. 验证环境

项目值
NPU 型号Ascend910
NPU 名称Ascend910_9362
PyTorch2.x
torch_npu已安装
timm已安装
Python3.x

3. 推理运行

pip install -r requirements.txt
python inference.py

推理输出示例:

Top-1: class_970 (prob=0.1415)
Top-2: class_979 (prob=0.1216)
Top-3: class_888 (prob=0.0902)
Top-4: class_912 (prob=0.0660)
Top-5: class_525 (prob=0.0511)

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.016343
mean_abs_error0.003490
relative_error0.4037%
cosine_similarity0.999993
threshold1.0%
结果PASS
  • CPU Top-1 与 NPU Top-1 类别一致
  • CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

指标值
Avg latency4.70 ms
Min latency4.65 ms
Max latency4.75 ms
P504.70 ms
P904.75 ms
P954.75 ms
Throughput212.8 images/s

测试条件:batch_size=1, input=[1,3,224,224], 预热 2 次 + 正式 10 次。

6. 精度评测

本项目仅执行 smoke consistency 验证(CPU vs NPU Top-1/Top-5 一致性),非 ImageNet 官方精度评测。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件说明
logs/inference.log推理日志
logs/accuracy.log精度验证日志
logs/benchmark.log性能基准日志
logs/env_check.log环境检查日志
logs/paths.txt模型路径信息

9. 注意事项

  • 本工程不提交模型权重(*.bin, *.safetensors 等已在 .gitignore 中排除)
  • 使用 pretrained=False + 本地权重加载,不使用 HuggingFace 直连下载
  • 不使用 fallback

10. 标签

#NPU