TinyNAS DAMO-YOLO 是一个轻量级目标检测模型,专用于头部检测任务。采用 TinyNAS 搜索的骨干网络、GiraffeNeckV2 FPN 和 ZeroHead 架构。
| 指标 | 值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 最大绝对误差 | 0.198364 |
| 相对误差 | 0.0235% |
| 平均延迟 | 11.86 ms |
| 峰值显存 | 0.21 GB |
| 参数量 | 16,306,421 |
| 推理精度 | float32 |
| 设备 | Ascend 910B4 |
| 组件 | 版本 |
|---|---|
| CANN | 8.5.1 |
| torch_npu | 2.9.0.post1 |
| PyTorch | 2.9.0 |
| Python | 3.11 |
# 设置环境
source setup_env.sh
# 运行推理 (CPU vs NPU 对比)
python3 inference.py --device npu:0NPU 推理输出(float32, 640x640 输入):
模型: iic/cv_tinynas_head-detection_damoyolo
设备: npu:0
------------------------------------------------------------
[CPU] 加载模型...
[CPU] 推理中...
CPU output shape: torch.Size([1, 8400, 5])
[NPU] 加载模型到 npu:0...
[NPU] 推理中...
NPU output shape: torch.Size([1, 8400, 5])
Cosine Similarity: 1.000000
MaxAbsErr: 0.198364
✓ 推理完成
[Perf] 加载模型测延迟...
平均延迟: 11.86 ms
峰值显存: 0.21 GB| 指标 | CPU (float32) | NPU (float32) | 误差 |
|---|---|---|---|
| 余弦相似度 | 基准 | 1.000000 | < 0.001% |
| 最大绝对误差 | - | 0.198364 | - |
| 相对误差 | - | 0.0235% | < 1% ✓ |
| 输出维度 | [1, 8400, 5] | [1, 8400, 5] | 一致 |
| 非数值(NaN) | False | False | 一致 |
详见 screenshots/verification.txt。
本适配由 Ascend NPU 适配智能体技能(Agent Skill)自动完成。