xujiashuai/timm-cv_cspnet_video-object-detection_longshortnet
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

cv_cspnet_video-object-detection_longshortnet 在昇腾 NPU 上的部署

1. 简介

  • 模型来源:iic/cv_cspnet_video-object-detection_longshortnet
  • 架构:LongShortNet(CSPNet 骨干网络 + SPP + YOLOX 检测头)
  • 参数量:27,075,968(仅骨干网络)
  • 任务:视频目标检测(Video Object Detection)
  • 适配状态:成功(SUCCESS)
  • 适配时间:2026-05-18

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPU昇腾 910B4

3. 精度评测

指标数值
余弦相似度(Cosine Similarity)0.999999
最大绝对误差(Max Abs Error)0.007388
是否满足要求是(余弦相似度 > 0.999)

4. 性能

指标数值
平均延迟6.75 毫秒
输出形状[1, 1024, 10, 10]

5. 适配说明

基于 checkpoint 重建 CSPNet 骨干网络结构,包含 stem 模块、dark2 至 dark5 阶段。每个阶段包含 ConvBnSiLU 下采样层和 C3/CSP 块(其中 dark5 阶段包含 SPP 模块)。输入为随机视频帧张量 (1, 12, 320, 320),即 4 帧 × 3 通道。

6. 推理输出证据

Model: iic/cv_cspnet_video-object-detection_longshortnet
Output shape: [1, 1024, 10, 10]
Latency: 6.75ms
Cosine Similarity: 0.999999
Max Abs Error: 0.007388

7. CPU 与 NPU 精度对比

指标CPUNPU差异
余弦相似度1.00.9999990.0001%
最大绝对误差-0.007388-