本项目将 timm/tf_efficientnetv2_b3.in21k 图像分类模型适配到单卡昇腾 NPU(Ascend910)上运行。模型基于 EfficientNetV2-B3 架构,在 ImageNet-21k 上预训练,输出 21843 维分类 logits。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
对单张测试输入进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.006106 |
| mean_abs_error | 0.001511 |
| relative_error | 0.0128% |
| cosine_similarity | 1.000000 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg_latency_ms | 13.156 |
| min_latency_ms | 12.694 |
| max_latency_ms | 13.578 |
| p50_latency_ms | 13.220 |
| p90_latency_ms | 13.446 |
| p95_latency_ms | 13.512 |
| throughput_ips | 76.01 |
测试条件:单卡 Ascend910,输入尺寸 [1, 3, 240, 240],预热 2 次 + 正式 10 次。
本项目包含单输入 smoke consistency 验证,非官方 ImageNet-21k 完整验证集评测。详细指标见第 4 节。
见 screenshots/self_verification.png。
| 日志 | 说明 |
|---|---|
logs/env_check.log | NPU 环境检查 |
logs/inference.log | NPU 推理输出 |
logs/accuracy.log | CPU-NPU 精度一致性 |
logs/benchmark.log | NPU 性能基准 |
snapshot_download 下载,严禁使用 HuggingFace 自动下载。pretrained=False,通过本地 model.safetensors 加载权重。timm.data.resolve_model_data_config 自动解析为 240x240。#NPU