将 timm/convnext_tiny.fb_in22k_ft_in1k(ConvNeXt-Tiny,ImageNet-22k 预训练后微调至 ImageNet-1K)适配为可在单卡昇腾 NPU(Ascend910B)上运行的提交工程。
pip install -r requirements.txt
python inference.py推理脚本通过 ModelScope snapshot_download 下载模型,使用 timm.create_model(pretrained=False) 创建结构并加载本地 safetensors 权重,在 npu:0 上执行推理,输出 Top-5 预测结果。
python eval_accuracy.py对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.017811 |
| mean_abs_error | 0.003295 |
| relative_error | 0.4815% |
| cosine_similarity | 0.999991 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 值 |
|---|---|
| 平均延迟 | 6.73 ms |
| 最小延迟 | 6.69 ms |
| 最大延迟 | 6.87 ms |
| P50 | 6.72 ms |
| P90 | 6.87 ms |
| P95 | 6.87 ms |
| 吞吐量 | 148.58 images/sec |
测试条件:batch=1, 224x224, warmup=2, runs=10
详见 logs/accuracy.log,为 smoke consistency 检查,非官方精度评测。
见 screenshots/self_verification.png
logs/inference.log — 推理结果logs/accuracy.log — 精度对比logs/benchmark.log — 性能测试logs/env_check.log — 环境检查#NPU