将 Facebook 的 RegNet-Y-320(SEER 自监督预训练,ImageNet-1K 微调)适配到华为昇腾 NPU(Ascend910)上运行。该模型包含约 145M 参数,使用 RegNetForImageClassification 架构,输入尺寸为 384x384。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.003831 |
| mean_abs_error | 0.000769 |
| relative_error | 0.0633% |
| cosine_similarity | 1.000000 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg_latency | 17.35 ms |
| min_latency | 16.60 ms |
| max_latency | 23.86 ms |
| p50_latency | 16.64 ms |
| p90_latency | 23.86 ms |
| p95_latency | 23.86 ms |
| images_per_sec | 57.63 |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png。
logs/inference.log — 推理结果logs/accuracy.log — CPU-NPU 精度一致性验证logs/benchmark.log — 性能基准测试logs/stage0.log — 模型预判与可用性检查from_pretrained(model_dir) 加载模型结构和权重