CS3EdgeNet-X 使用 Edge 卷积块替代标准卷积,在保持精度的同时减少参数量。
本仓库提供了适配 Ascend NPU 的 CS3EdgeNet-X 模型推理脚本,支持在华为昇腾 910 芯片上进行高效推理。
| 属性 | 值 |
|---|---|
| 模型架构 | CS3EdgeNet-X (c2) |
| 输入尺寸 | 256x256 |
| 预训练数据 | ImageNet-1k |
| 类别数 | 1000 |
| 权重文件大小 | ~183 MB |
| 权重来源 | ModelScope (timm/cs3edgenet_x.c2_in1k) |
| 环境 | 版本 / 信息 |
|---|---|
| PyTorch | >= 2.0.0 |
| torch_npu | Ascend910 |
| timm | >= 1.0.0 |
| Python | 3.11+ |
| 操作系统 | Linux (aarch64) |
测试使用 8 张 256x256 测试图像,在 CPU(ARM)和 Ascend910 NPU 上分别运行推理。
| 设备 | 平均耗时 (s/img) | 总耗时 (8 imgs) | 加速比 |
|---|---|---|---|
| CPU (ARM) | 0.4556 | 3.6449s | 1.0x (baseline) |
| NPU (Ascend910) | 0.0263 | 0.2100s | 17.4x |
CPU 与 NPU 推理结果的精度对比(使用 8 张测试图像):
| 指标 | 值 |
|---|---|
| Cosine Similarity (logits) | 0.99999684 |
| Top-1 匹配率 | 100.0% |
| Top-1 匹配数 | 8/8 |
| 最大概率差异 | 0.00006254 |
| 平均相对概率误差 | 0.1333% |
| 图像 | CPU Top-1 | NPU Top-1 | 匹配 | Top-5 重合 | Cosine Sim |
|---|---|---|---|---|---|
| cat_like.jpg | 111 | 111 | ✓ | 5/5 | 0.999999 |
| desert_like.jpg | 111 | 111 | ✓ | 4/5 | 0.999995 |
| forest_like.jpg | 21 | 21 | ✓ | 5/5 | 0.999999 |
| gradient_0.jpg | 473 | 473 | ✓ | 5/5 | 0.999988 |
| gradient_1.jpg | 549 | 549 | ✓ | 5/5 | 0.999999 |
| mountain_like.jpg | 21 | 21 | ✓ | 5/5 | 0.999999 |
| ocean_like.jpg | 21 | 21 | ✓ | 5/5 | 0.999999 |
| sky_like.jpg | 21 | 21 | ✓ | 5/5 | 0.999996 |
NPU 与 CPU 推理结果误差 < 1%。所有 8 张测试图像的 Top-1 预测结果完全一致(8/8,100%), logits 的 Cosine Similarity 达到 0.99999684(> 0.999),满足精度要求。
以下是 cs3edgenet_x 在 CPU 和 NPU 上的推理过程及精度对比的终端截图:

# 从 ModelScope 下载模型权重
python3 -c "
import urllib.request
url = 'https://www.modelscope.cn/models/timm/cs3edgenet_x.c2_in1k/resolve/master/model.safetensors'
urllib.request.urlretrieve(url, 'model.safetensors')
"# CPU 推理
python3 inference.py cpu results_cpu.json
# NPU 推理
python3 inference.py npu results_npu.jsonpython3 compare_cpu_npu.py results_cpu.json results_npu.jsoninference.py — CPU 和 NPU 推理脚本,支持加载 safetensors 权重compare_cpu_npu.py — CPU 与 NPU 推理结果对比脚本,计算精度指标以下日志展示了 NPU 推理成功的关键信息:
cat_like.jpg: top-1 class 111, prob 0.0082, time 0.161s
desert_like.jpg: top-1 class 111, prob 0.0047, time 0.007s
forest_like.jpg: top-1 class 21, prob 0.0237, time 0.007s
gradient_0.jpg: top-1 class 473, prob 0.0062, time 0.007s
gradient_1.jpg: top-1 class 549, prob 0.0145, time 0.007s
mountain_like.jpg: top-1 class 21, prob 0.0077, time 0.007s