将 timm 库的 PiT-Small (Pool-based vision transformer) 图片分类模型适配到华为昇腾 NPU (Ascend910)。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 创建模型结构并加载本地权重。
timm/pit_s_224.in1k| 项目 | 值 |
|---|---|
| 设备 | Ascend910_9362 |
| PyTorch | torch |
| torch_npu | torch_npu |
| timm | 1.0.27 |
| modelscope | 1.35.3 |
# 安装依赖
pip install -r requirements.txt
# 运行推理
python inference.py
# 运行精度验证
python eval_accuracy.py
# 运行性能基准测试
python benchmark.py推理结果示例(测试图片):
| 排名 | 类别 | 概率 |
|---|---|---|
| Top-1 | class_0445 | 27.62% |
| Top-2 | class_0838 | 19.90% |
| Top-3 | class_0978 | 15.99% |
| Top-4 | class_0977 | 12.87% |
| Top-5 | class_0638 | 3.66% |
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.015340 |
| mean_abs_error | 0.003427 |
| relative_error | 0.4385% |
| cosine_similarity | 0.999993 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 5.85 ms |
| 最小延迟 | 5.70 ms |
| 最大延迟 | 6.14 ms |
| P50 延迟 | 5.82 ms |
| P90 延迟 | 5.96 ms |
| P95 延迟 | 6.05 ms |
| 吞吐量 | 171.00 images/sec |
| 设备 | Ascend910_9362 |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png。
logs/inference.log — 推理结果日志logs/accuracy.log — 精度验证日志logs/benchmark.log — 性能基准测试日志logs/stage0_result.txt — 阶段 0 验证结果