将 timm 预训练模型 ViT-Base-Patch16-384 (ImageNet-21K 预训练 + ImageNet-1K 微调) 适配到华为昇腾 NPU (Ascend910) 上运行。该模型是 Vision Transformer 基础模型,输入分辨率 384x384,适合高精度图像分类任务。
| 项目 | 配置 |
|---|---|
| 硬件 | 华为昇腾 910 NPU |
| 框架 | PyTorch + torch_npu |
| 模型来源 | ModelScope snapshot_download |
| 权重格式 | safetensors |
| 输入分辨率 | 384x384 |
# 安装依赖
pip install -r requirements.txt
# 运行推理
python inference.py推理输出 Top-5 预测:
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.030037 |
| mean_abs_error | 0.007863 |
| relative_error | 0.7764% |
| cosine_similarity | 0.999974 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| 输入尺寸 | 384x384 |
| 平均延迟 | ms ms |
| 吞吐量 | images/sec images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
详见 screenshots/self_verification.png
| 文件 | 说明 |
|---|---|
| logs/inference.log | 推理运行日志 |
| logs/accuracy.log | 精度验证日志 |
| logs/benchmark.log | 性能基准测试日志 |
| logs/env_check.log | 环境检查日志 |
timm.data.resolve_model_data_config 自动生成timm.create_model(pretrained=False) 加载本地权重本项目适配到华为昇腾 NPU (Ascend910),支持 NPU 推理。