xujiashuai/ghostnet_100
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm-ghostnet_100.in1k - Ascend NPU 适配

1. 模型信息

  • 模型: timm-ghostnet_100.in1k
  • 来源: timm
  • 任务: ImageNet 图像分类

2. 昇腾 NPU 适配结果

指标值
设备Ascend 910B4
精度float32
Cosine Similarity0.999999
Max Absolute Error0.006553
NPU 推理时间8.96ms

3. 推理脚本

python3 inference.py

4. 推理输出证据

=== ghostnet_100.in1k ===
Dtype: torch.float32

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.7105944156646729, -0.0036331184674054384, -0.7227957844734192, 0.3264969289302826, 0.9221805334091187]
推理时间: 108.57ms

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.709502100944519, -0.004014733713120222, -0.7219572067260742, 0.3267768919467926, 0.9221465587615967]
推理时间: 8.96ms

=== 精度对比 ===
Cosine Similarity: 0.999999
Max Absolute Error: 0.006553
Relative Error: 0.005109

✓ NPU 适配通过

5. 精度校验

CPU 与 NPU 推理结果对比:

  • Cosine Similarity: 0.999999 (> 0.99 通过)
  • Max Absolute Error: 0.006553

6. 复现步骤

# 安装依赖
pip install torch torch_npu timm huggingface_hub safetensors

# 运行推理
python3 inference.py

7. 环境要求

  • Python 3.11+
  • PyTorch 2.9.0+
  • torch_npu 2.9.0+
  • CANN 8.5.1
  • Ascend 910B4

8. Agent Skill

本适配由 vision-encoder-npu-adapt Agent Skill 自动完成,包含:

  • 模型加载与权重下载(ModelScope fallback)
  • NPU 迁移与 FP32 推理
  • CPU vs NPU 精度对比验证
  • 性能基准测试