e
gcw_GSiqzzLf/cs3sedarknet_l.c2ns_in1k-npu
模型介绍文件和版本Pull Requests讨论分析

CS3SEDarkNet-L-NPU

模型简介

CS3SEDarkNet-L 融合了 SE 注意力机制的 DarkNet 大规模版本。

本仓库提供了适配 Ascend NPU 的 CS3SEDarkNet-L 模型推理脚本,支持在华为昇腾 910 芯片上进行高效推理。

模型详情

属性值
模型架构CS3SEDarkNet-L (c2ns)
输入尺寸256x256
预训练数据ImageNet-1k
类别数1000
权重文件大小~84 MB
权重来源ModelScope (timm/cs3sedarknet_l.c2ns_in1k)

环境配置

环境版本 / 信息
PyTorch>= 2.0.0
torch_npuAscend910
timm>= 1.0.0
Python3.11+
操作系统Linux (aarch64)

推理性能

测试使用 8 张 256x256 测试图像,在 CPU(ARM)和 Ascend910 NPU 上分别运行推理。

设备平均耗时 (s/img)总耗时 (8 imgs)加速比
CPU (ARM)0.22501.7998s1.0x (baseline)
NPU (Ascend910)0.03200.2559s7.0x

精度对比

CPU 与 NPU 推理结果的精度对比(使用 8 张测试图像):

指标值
Cosine Similarity (logits)0.99999925
Top-1 匹配率100.0%
Top-1 匹配数8/8
最大概率差异0.00025657
平均相对概率误差0.1056%

逐图像结果

图像CPU Top-1NPU Top-1匹配Top-5 重合Cosine Sim
cat_like.jpg549549✓5/50.999998
desert_like.jpg701701✓5/51.000000
forest_like.jpg326326✓5/51.000000
gradient_0.jpg549549✓5/51.000000
gradient_1.jpg549549✓5/50.999999
mountain_like.jpg111111✓5/50.999998
ocean_like.jpg2121✓5/50.999999
sky_like.jpg2121✓5/51.000000

精度测试结论

NPU 与 CPU 推理结果误差 < 1%。所有 8 张测试图像的 Top-1 预测结果完全一致(8/8,100%), logits 的 Cosine Similarity 达到 0.99999925(> 0.999),满足精度要求。

推理终端输出

以下是 cs3sedarknet_l 在 CPU 和 NPU 上的推理过程及精度对比的终端截图:

终端输出

快速使用

1. 下载权重

# 从 ModelScope 下载模型权重
python3 -c "
import urllib.request
url = 'https://www.modelscope.cn/models/timm/cs3sedarknet_l.c2ns_in1k/resolve/master/model.safetensors'
urllib.request.urlretrieve(url, 'model.safetensors')
"

2. 运行推理

# CPU 推理
python3 inference.py cpu results_cpu.json

# NPU 推理
python3 inference.py npu results_npu.json

3. 对比结果

python3 compare_cpu_npu.py results_cpu.json results_npu.json

推理脚本

  • inference.py — CPU 和 NPU 推理脚本,支持加载 safetensors 权重
  • compare_cpu_npu.py — CPU 与 NPU 推理结果对比脚本,计算精度指标

参考

  • timm 模型库
  • ModelScope 权重主页
  • YOLO / DarkNet 论文

推理成功证据

以下日志展示了 NPU 推理成功的关键信息:

cat_like.jpg: top-1 class 549, prob 0.0102, time 0.189s
desert_like.jpg: top-1 class 701, prob 0.0156, time 0.010s
forest_like.jpg: top-1 class 326, prob 0.0171, time 0.010s
gradient_0.jpg: top-1 class 549, prob 0.0137, time 0.010s
gradient_1.jpg: top-1 class 549, prob 0.0324, time 0.010s
mountain_like.jpg: top-1 class 111, prob 0.0131, time 0.009s

模型标签

  • #+NPU
  • #+CV
  • #+图像分类
  • #+昇腾
  • #+Ascend
  • #+timm
下载使用量0