本项目将 timm/poolformer_s36.sail_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910)。PoolFormer S36 是基于 MetaFormer 架构的视觉骨干网络,使用池化操作作为核心 token mixer,在 ImageNet-1K 上进行预训练。
# 确保模型权重已通过 ModelScope 下载
python inference.py推理结果(单张测试图片):
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.009354 |
| mean_abs_error | 0.002332 |
| relative_error | 0.5513% |
| cosine_similarity | 0.999987 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg latency | 19.24 ms |
| min latency | 15.18 ms |
| max latency | 41.12 ms |
| p50 | 16.98 ms |
| p90 | 21.63 ms |
| p95 | 31.38 ms |
| throughput | 51.99 images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png。
logs/inference.log — 推理输出日志logs/accuracy.log — 精度一致性验证日志logs/benchmark.log — 性能基准测试日志logs/env_check.log — 环境检查日志snapshot_download 下载,不使用 HuggingFace 直连timm.create_model(pretrained=False) + 本地权重加载,不使用 pretrained=True#NPU