本项目将 timm/cait_xxs36_384.fb_dist_in1k 图像分类模型适配到单卡昇腾 NPU(Ascend910)上运行。模型基于 CAIT(Class-Attention in Image Transformers)XXS/36 架构,输入分辨率 384x384,在 ImageNet-1k 上通过蒸馏训练,输出 1000 维分类 logits。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
对单张测试输入进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.013093 |
| mean_abs_error | 0.003398 |
| relative_error | 0.4720% |
| cosine_similarity | 0.999990 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| avg_latency_ms | 30.146 |
| min_latency_ms | 28.812 |
| max_latency_ms | 31.530 |
| p50_latency_ms | 29.617 |
| p90_latency_ms | 31.489 |
| p95_latency_ms | 31.510 |
| throughput_ips | 33.17 |
测试条件:单卡 Ascend910,输入尺寸 [1, 3, 384, 384],预热 2 次 + 正式 10 次。
本项目包含单输入 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
见 screenshots/self_verification.png。
| 日志 | 说明 |
|---|---|
logs/env_check.log | NPU 环境检查 |
logs/inference.log | NPU 推理输出 |
logs/accuracy.log | CPU-NPU 精度一致性 |
logs/benchmark.log | NPU 性能基准 |
snapshot_download 下载,严禁使用 HuggingFace 自动下载。pretrained=False,通过本地 model.safetensors 加载权重。timm.data.resolve_model_data_config 自动解析为 384x384。#NPU