本项目将 timm/efficientnet_b3.ra2_in1k 图片分类模型适配到华为昇腾 NPU(Ascend910)上运行。
安装依赖:
pip install -r requirements.txtpython inference.py推理结果示例(单张测试图片):
| Rank | Class | Probability |
|---|---|---|
| 1 | class_975 | 0.1576 |
| 2 | class_979 | 0.1063 |
| 3 | class_738 | 0.0363 |
| 4 | class_703 | 0.0263 |
| 5 | class_912 | 0.0206 |
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.016720 |
| mean_abs_error | 0.002402 |
| relative_error | 0.1698% |
| cosine_similarity | 0.999998 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| Warmup | 2 |
| Runs | 10 |
| avg latency | 28.796 ms |
| min latency | 23.906 ms |
| max latency | 42.859 ms |
| p50 latency | 27.051 ms |
| p90 latency | 42.859 ms |
| p95 latency | 42.859 ms |
| Throughput | 34.73 images/sec |
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
见 screenshots/self_verification.png
logs/inference.log — 推理结果logs/accuracy.log — CPU-NPU 精度一致性logs/benchmark.log — 性能基准测试| 项目 | 链接 |
|---|---|
| 原始权重模型地址 | https://modelscope.cn/models/timm/efficientnet_b3.ra2_in1k |
| 提交项目地址 | https://ai.gitcode.com/v50_/timm-efficientnet_b3.ra2_in1k-NPU |
提交说明:适配 timm/efficientnet_b3.ra2_in1k 到昇腾 NPU (Ascend910)。使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重,包含推理验证、CPU-NPU 精度一致性检查和性能基准测试。
pretrained=False 并通过 load_state_dict 加载本地权重#NPU #Ascend #Ascend910 #ImageClassification #timm