本文档记录了 timm/regnetx_032.pycls_in1k 模型在华为昇腾 NPU (Ascend910) 上的适配过程和验证结果。
RegNet-X 320 是 Meta 提出的基于规则的网络架构,通过设计空间搜索得到的高效卷积神经网络。X 变体使用标准卷积操作。032 是该系列中的一个变体,在 ImageNet 上进行图像分类预训练。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.008419 |
| mean_abs_error | 0.001747 |
| relative_error | 0.0839% |
| cosine_similarity | 1.000000 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg_latency | 8.91 ms |
| min_latency | 8.54 ms |
| max_latency | 9.45 ms |
| p50_latency | 9.00 ms |
| p90_latency | 9.16 ms |
| p95_latency | 9.31 ms |
| throughput | 112.20 images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png 和 screenshots/self_verification.txt。
logs/env_check.log - NPU 环境检查logs/inference.log - 推理结果logs/accuracy.log - 精度验证logs/benchmark.log - 性能测试#NPU #Ascend #Ascend910 #RegNet #ImageClassification #timm