本项目将 ModelScope 模型 timm/mobilenetv4_hybrid_medium.e500_r224_in1k 适配为可在单卡昇腾 NPU(Ascend910)上运行的提交工程。
timm.create_model(pretrained=False) + ModelScope 本地权重加载| 项目 | 版本/型号 |
|---|---|
| NPU | Ascend910 |
| npu-smi | 25.5.2 |
| PyTorch | 2.x |
| torch_npu | 适配版本 |
| timm | latest |
| modelscope | latest |
环境详情见 logs/env_check.log。
pip install -r requirements.txt
python inference.py推理脚本使用 model_utils.py 统一加载模型,通过 timm.data.resolve_model_data_config + create_transform 进行预处理,并在 npu:0 上执行真实推理。
推理结果 (NPU Top-5):
python eval_accuracy.py对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.008750 |
| mean_abs_error | 0.001427 |
| relative_error | 0.0168% |
| cosine_similarity | 1.000000 |
| threshold | 1.0% |
| 结果 | PASS |
python benchmark.py| 指标 | 数值 |
|---|---|
| avg latency | 12.41 ms |
| min latency | 12.13 ms |
| max latency | 12.56 ms |
| p50 | 12.44 ms |
| p90 | 12.50 ms |
| p95 | 12.53 ms |
| images/sec | 80.59 |
测试条件:batch=1, 输入 224x224, 预热 2 次 + 正式 10 次。
本工程未包含完整 ImageNet 验证集精度评测,仅提供 CPU/NPU 一致性 smoke 测试。如需完整精度,请使用 ImageNet 验证集运行标准评测。
见 screenshots/self_verification.png 与 screenshots/self_verification.txt。
| 日志 | 内容 |
|---|---|
logs/env_check.log | NPU 环境信息 |
logs/inference.log | 推理结果与 Top-5 |
logs/accuracy.log | CPU/NPU 一致性对比 |
logs/benchmark.log | 性能基准测试 |
logs/paths.txt | 模型下载路径与权重路径 |
.gitignore 已排除所有权重文件(*.bin, *.safetensors, *.pth, *.pt, *.ckpt, *.onnx)。首次运行时会通过 ModelScope snapshot_download 自动下载到本地缓存。npu:0,前后调用 torch.npu.synchronize() 确保计时准确。#NPU