将 timm/repvgg_a0.rvgg_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910) 单卡推理。RepVGG-A0 是一种简洁高效的 CNN 分类架构,通过结构重参数化在推理时获得多分支性能。
timm/repvgg_a0.rvgg_in1k| 项目 | 值 |
|---|---|
| NPU | Ascend910 |
| npu-smi | OK |
| torch | PyTorch |
| torch_npu | 已安装 |
| timm | 已安装 |
| 模型下载方式 | ModelScope snapshot_download |
# 安装依赖
pip install -r requirements.txt
# 推理测试
python inference.py
# 精度验证
python eval_accuracy.py
# 性能基准
python benchmark.py推理输出示例:
input shape: [1, 3, 224, 224]
output shape: [1, 1000]
inference time: 6.62 ms
Top-5 predictions:
class_499: 0.0216
class_623: 0.0202
class_534: 0.0202
class_813: 0.0187
class_846: 0.0177对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.010470 |
| mean_abs_error | 0.002980 |
| relative_error | 0.2641% |
| cosine_similarity | 0.999997 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| 平均推理时间 | 6.24 ms |
| 最小推理时间 | 5.99 ms |
| 最大推理时间 | 6.52 ms |
| P50 | 6.22 ms |
| P90 | 6.38 ms |
| P95 | 6.45 ms |
| 吞吐量 | 160.36 images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png。
logs/inference.log — 推理结果日志logs/accuracy.log — 精度一致性验证日志logs/benchmark.log — 性能基准测试日志logs/env_check.log — NPU 环境检查日志snapshot_download 下载模型权重timm.create_model(pretrained=False) 创建模型结构并加载本地权重#NPU #Ascend #Ascend910 #RepVGG #ImageClassification #timm