本工程将 timm/vit_base_patch16_224.augreg_in21k_ft_in1k(ViT-Base/16,ImageNet-21K 预训练后在 ImageNet-1K 微调)适配为可在单卡昇腾 NPU(Ascend910B)上运行的推理提交工程。
pip install -r requirements.txt
python inference.py推理输出 Top-5 预测:
| 排名 | 类别 | 概率 |
|---|---|---|
| 1 | class_145 | 0.1473 |
| 2 | class_150 | 0.1282 |
| 3 | class_460 | 0.0790 |
| 4 | class_978 | 0.0673 |
| 5 | class_143 | 0.0377 |
python eval_accuracy.py对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.053004 |
| mean_abs_error | 0.010709 |
| relative_error | 0.7840% |
| cosine_similarity | 0.999971 |
| threshold | 1.0% |
| 结果 | PASS |
python benchmark.py| 指标 | 结果 |
|---|---|
| Warmup | 2 次 |
| 迭代次数 | 10 次 |
| 平均延迟 | 5.17 ms |
| 最小延迟 | 5.11 ms |
| 最大延迟 | 5.23 ms |
| P50 延迟 | 5.18 ms |
| P90 延迟 | 5.21 ms |
| P95 延迟 | 5.22 ms |
| 吞吐量 | 193.27 images/sec |
本工程提供 smoke 一致性验证(eval_accuracy.py),验证 CPU 与 NPU 推理结果的一致性。Top-1/Top-5 均匹配,logit 最大差异 < 0.06。
若需完整 ImageNet 精度评测,请使用独立的评测脚本和完整验证集。
详见 screenshots/self_verification.png 和 screenshots/self_verification.txt。
logs/inference.log — 推理结果logs/accuracy.log — 精度验证结果logs/benchmark.log — 性能基准测试结果logs/paths.txt — 模型路径记录#NPU