CS3DarkNet-M 是 CS3DarkNet 系列的中等规模版本,在速度和精度之间取得平衡。
本仓库提供了适配 Ascend NPU 的 CS3DarkNet-M 模型推理脚本,支持在华为昇腾 910 芯片上进行高效推理。
| 属性 | 值 |
|---|---|
| 模型架构 | CS3DarkNet-M (c2ns) |
| 输入尺寸 | 256x256 |
| 预训练数据 | ImageNet-1k |
| 类别数 | 1000 |
| 权重文件大小 | ~36 MB |
| 权重来源 | ModelScope (timm/cs3darknet_m.c2ns_in1k) |
| 环境 | 版本 / 信息 |
|---|---|
| PyTorch | >= 2.0.0 |
| torch_npu | Ascend910 |
| timm | >= 1.0.0 |
| Python | 3.11+ |
| 操作系统 | Linux (aarch64) |
测试使用 8 张 256x256 测试图像,在 CPU(ARM)和 Ascend910 NPU 上分别运行推理。
| 设备 | 平均耗时 (s/img) | 总耗时 (8 imgs) | 加速比 |
|---|---|---|---|
| CPU (ARM) | 0.1018 | 0.8143s | 1.0x (baseline) |
| NPU (Ascend910) | 0.0243 | 0.1941s | 4.2x |
CPU 与 NPU 推理结果的精度对比(使用 8 张测试图像):
| 指标 | 值 |
|---|---|
| Cosine Similarity (logits) | 0.99999860 |
| Top-1 匹配率 | 100.0% |
| Top-1 匹配数 | 8/8 |
| 最大概率差异 | 0.00015731 |
| 平均相对概率误差 | 0.1279% |
| 图像 | CPU Top-1 | NPU Top-1 | 匹配 | Top-5 重合 | Cosine Sim |
|---|---|---|---|---|---|
| cat_like.jpg | 629 | 629 | ✓ | 5/5 | 0.999997 |
| desert_like.jpg | 644 | 644 | ✓ | 5/5 | 0.999999 |
| forest_like.jpg | 644 | 644 | ✓ | 5/5 | 0.999999 |
| gradient_0.jpg | 623 | 623 | ✓ | 5/5 | 0.999999 |
| gradient_1.jpg | 644 | 644 | ✓ | 5/5 | 0.999998 |
| mountain_like.jpg | 111 | 111 | ✓ | 5/5 | 0.999998 |
| ocean_like.jpg | 701 | 701 | ✓ | 5/5 | 0.999999 |
| sky_like.jpg | 21 | 21 | ✓ | 5/5 | 0.999999 |
NPU 与 CPU 推理结果误差 < 1%。所有 8 张测试图像的 Top-1 预测结果完全一致(8/8,100%), logits 的 Cosine Similarity 达到 0.99999860(> 0.999),满足精度要求。
以下是 cs3darknet_m 在 CPU 和 NPU 上的推理过程及精度对比的终端截图:

# 从 ModelScope 下载模型权重
python3 -c "
import urllib.request
url = 'https://www.modelscope.cn/models/timm/cs3darknet_m.c2ns_in1k/resolve/master/model.safetensors'
urllib.request.urlretrieve(url, 'model.safetensors')
"# CPU 推理
python3 inference.py cpu results_cpu.json
# NPU 推理
python3 inference.py npu results_npu.jsonpython3 compare_cpu_npu.py results_cpu.json results_npu.jsoninference.py — CPU 和 NPU 推理脚本,支持加载 safetensors 权重compare_cpu_npu.py — CPU 与 NPU 推理结果对比脚本,计算精度指标以下日志展示了 NPU 推理成功的关键信息:
cat_like.jpg: top-1 class 629, prob 0.0118, time 0.159s
desert_like.jpg: top-1 class 644, prob 0.0099, time 0.005s
forest_like.jpg: top-1 class 644, prob 0.0144, time 0.005s
gradient_0.jpg: top-1 class 623, prob 0.0121, time 0.005s
gradient_1.jpg: top-1 class 644, prob 0.0120, time 0.005s
mountain_like.jpg: top-1 class 111, prob 0.0161, time 0.005s