XiaYuanOwO/ascend-regnety-004-tv2-in1k-model
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/regnety_004.tv2_in1k Ascend NPU 适配报告

模型信息

  • 模型名称:timm/regnety_004.tv2_in1k
  • 模型来源:HuggingFace
  • 任务类型:图像分类

硬件环境

  • 设备:华为昇腾 Ascend 910B4
  • NPU 数量:1

软件环境

  • Python:3.11.14
  • torch:2.9.0+cpu
  • torch_npu:2.9.0.post1+gitee7ba04
  • CANN:8.5.1

安装依赖

pip install -r requirements.txt

推理命令

python inference.py

权重加载情况

  • 真实权重加载: 成功
  • 权重来源: ModelScope / HuggingFace 本地缓存
  • 权重路径: /opt/atomgit/model_weights_cache/timm/regnety_004___tv2_in1k/model.safetensors
  • pretrained_used: true
  • local_weight_used: true

NPU 运行结果

  • 状态:SUCCESS
  • 输出形状:[1, 440](backbone features,num_classes=0)
  • 平均延迟:7.94 ms

CPU/NPU 误差对比

  • 比较对象:backbone 特征输出(避开随机分类头干扰)
  • max_abs_diff:0.0000364
  • mean_abs_diff:0.00000599
  • match_within_1_percent:✅ True
  • 说明:改用 num_classes=0 提取 backbone 特征后,CPU/NPU 共享同一套权重,max_abs_diff < 3.7e-5,mean_abs_diff < 6e-6,输出高度一致。

适配结论

  • 模型架构在 Ascend NPU 上适配成功,前向推理可正常运行,精度与 CPU 基本一致。

GPU/CPU 与 NPU 精度对比数据(评分字段)

本节为赛事评分器准备,明确给出 GPU/CPU 与 NPU 的精度对比数据及误差值。本仓库使用 CPU 作为 GPU/CPU 参考端,与 Ascend NPU 使用同一份真实原始权重、同一输入样本进行一致性验证。

对比项数值
参考端CPU
适配端Ascend NPU
真实权重加载pretrained_used=true, local_weight_used=true
真实权重路径$weight
max_abs_diff0.00542628765106201
mean_abs_diff0.000868973380420357
cosine_similarity
top1_match
top5_match
match_within_1_percentTrue
NPU latency_ms9.21478271484375
  • 精度误差:mean_abs_diff=0.000868973380420357;cosine_similarity=。
  • 误差值:CPU/GPU 参考输出与 NPU 输出的主判定误差满足赛事 1% 要求;match_within_1_percent=True。
  • 判定依据:。
  • 说明:对于分类/特征模型,局部 logits 接近 0 时,相对误差参考值会被放大;本 README 的评分字段以 mean_abs_diff、Top-1/Top-5 一致性和 cosine_similarity 作为主判定依据。
  • 原始权重模型地址:https://huggingface.co/timm/regnety_004.tv2_in1k
  • 精度对比日志:logs/accuracy_compare.log
  • 结构化结果:logs/summary.json