xujiashuai/ghostnetv2_100
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm-ghostnetv2_100.in1k - Ascend NPU 适配

1. 模型信息

  • 模型: timm-ghostnetv2_100.in1k
  • 来源: timm
  • 任务: ImageNet 图像分类

2. 昇腾 NPU 适配结果

指标值
设备Ascend 910B4
精度float32
Cosine Similarity1.000000
Max Absolute Error0.002352
NPU 推理时间14.49ms

3. 推理脚本

python3 inference.py

4. 推理输出证据

=== ghostnetv2_100.in1k ===
Dtype: torch.float32

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.9079675674438477, 0.0586068369448185, -0.32857614755630493, -0.35240447521209717, -0.3611944913864136]
推理时间: 306.25ms

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.9083774089813232, 0.058787889778614044, -0.32843396067619324, -0.3517896831035614, -0.360188364982605]
推理时间: 14.49ms

=== 精度对比 ===
Cosine Similarity: 1.000000
Max Absolute Error: 0.002352
Relative Error: 0.005351

✓ NPU 适配通过

5. 精度校验

CPU 与 NPU 推理结果对比:

  • Cosine Similarity: 1.000000 (> 0.99 通过)
  • Max Absolute Error: 0.002352

6. 复现步骤

# 安装依赖
pip install torch torch_npu timm huggingface_hub safetensors

# 运行推理
python3 inference.py

7. 环境要求

  • Python 3.11+
  • PyTorch 2.9.0+
  • torch_npu 2.9.0+
  • CANN 8.5.1
  • Ascend 910B4

8. Agent Skill

本适配由 vision-encoder-npu-adapt Agent Skill 自动完成,包含:

  • 模型加载与权重下载(ModelScope fallback)
  • NPU 迁移与 FP32 推理
  • CPU vs NPU 精度对比验证
  • 性能基准测试