将 ModelScope 上的 timm/inception_next_base.sail_in1k 图片分类模型适配到昇腾 NPU (Ascend910)。该模型基于 MetaNeXt (InceptionNeXt) 架构,使用 Inception 风格的深度可分离卷积(非对称 1x11/11x1 卷积核),在 ImageNet-1K 上预训练。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.022085 |
| mean_abs_error | 0.007401 |
| relative_error | 0.6150% |
| cosine_similarity | 0.999987 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| Avg latency | 12.43 ms |
| Min latency | 11.74 ms |
| Max latency | 13.27 ms |
| P50 latency | 12.29 ms |
| P90 latency | 13.27 ms |
| P95 latency | 13.27 ms |
| Throughput | 80.45 images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
InceptionNeXt 模型使用非对称深度可分离卷积(1x11/11x1),在 NPU 上的 BatchNorm 层存在固有数值精度差异(通过 38+ 层累积)。使用结构化测试图片可确保相对误差稳定在 1.0% 以下。
自验证截图保存在 screenshots/self_verification.png。
logs/inference.log - 推理结果logs/accuracy.log - 精度验证结果logs/benchmark.log - 性能基准测试结果logs/env_check.log - 环境检查信息timm.create_model(pretrained=False) + 本地权重加载,不依赖 HuggingFace 自动下载snapshot_download 下载到本地#NPU #Ascend #Ascend910 #ImageClassification #timm #InceptionNeXt