xujiashuai/tinynet_d
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm-tinynet_d.in1k - Ascend NPU 适配

1. 模型信息

  • 模型: timm-tinynet_d.in1k
  • 来源: timm
  • 任务: ImageNet 图像分类

2. 昇腾 NPU 适配结果

指标值
设备Ascend 910B4
精度float32
Cosine Similarity0.999999
Max Absolute Error0.009554
NPU 推理时间4.82ms

3. 推理脚本

python3 inference.py

4. 推理输出证据

=== tinynet_d.in1k ===
Dtype: torch.float32

--- CPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.23708903789520264, -0.16539707779884338, -1.516122817993164, -0.13567812740802765, 0.9884318113327026]
推理时间: 92.63ms

--- NPU 推理 ---
输出形状: torch.Size([1, 1000])
输出前5值: [-0.23514406383037567, -0.16472090780735016, -1.5170665979385376, -0.13631096482276917, 0.988941490650177]
推理时间: 4.82ms

=== 精度对比 ===
Cosine Similarity: 0.999999
Max Absolute Error: 0.009554
Relative Error: 0.005753

✓ NPU 适配通过

5. 精度校验

CPU 与 NPU 推理结果对比:

  • Cosine Similarity: 0.999999 (> 0.99 通过)
  • Max Absolute Error: 0.009554

6. 复现步骤

# 安装依赖
pip install torch torch_npu timm huggingface_hub safetensors

# 运行推理
python3 inference.py

7. 环境要求

  • Python 3.11+
  • PyTorch 2.9.0+
  • torch_npu 2.9.0+
  • CANN 8.5.1
  • Ascend 910B4

8. Agent Skill

本适配由 vision-encoder-npu-adapt Agent Skill 自动完成,包含:

  • 模型加载与权重下载(ModelScope fallback)
  • NPU 迁移与 FP32 推理
  • CPU vs NPU 精度对比验证
  • 性能基准测试