convnext tiny hnf - a2h in1k 是 ConvNeXt 系列图像分类模型的一个变体,基于纯卷积架构设计,在 ImageNet 等大规模数据集上预训练。ConvNeXt 通过借鉴 Swin Transformer 的设计思路对标准 ResNet 进行现代化改造,实现了媲美 Transformer 的性能。
本模型已适配昇腾 Ascend 910 NPU,支持在 NPU 上进行推理。核心适配工作包括:
torch.npu 将模型加载到 NPU 设备。torch.npu.synchronize() 确保 NPU 同步执行。pip install torch torch-npu timm Pillow safetensors# CPU 推理
python3 inference.py --model convnext_tiny_hnf.a2h_in1k --device cpu --image test.jpg
# NPU 推理
python3 inference.py --model convnext_tiny_hnf.a2h_in1k --device npu --image test.jpg
Device: CPU
Inference time: 0.3126s
Top-5 predictions:
1. class= 916 prob=0.445794
2. class= 549 prob=0.287272
3. class= 722 prob=0.034609
4. class= 417 prob=0.005616
5. class= 782 prob=0.004545
Device: NPU
Inference time: 0.0076s
Top-5 predictions:
1. class= 916 prob=0.446208
2. class= 549 prob=0.287695
3. class= 722 prob=0.034371
4. class= 417 prob=0.005538
5. class= 782 prob=0.004545
| 指标 | 值 |
|---|---|
| MAE | 0.00366400 |
| MSE | 0.00002524" if results else "-" |
| 最大绝对误差 | 0.02391797 |
| 余弦相似度 | 0.99998897 |
| Top-100 平均相对误差 | 0.2881% |
| Top-1 分类一致 | 是 |
| Top-5 重叠数 | 5/5 |
结论:NPU 与 CPU 推理结果误差 < 1%,精度完全满足要求。
基于现有评测数据,CPU 与 NPU 的 余弦相似度 精度误差为 0.0011%,小于 1% 的精度要求。
基于现有评测数据,CPU 与 NPU 的 余弦相似度 精度误差为 0.0011%,小于 1% 的精度要求。
| 设备 | 推理耗时 |
|---|---|
| CPU | 0.2987 s |
| NPU | 0.0076 s |
| 加速比 | 39.13× |
以下日志展示了 NPU 推理成功的关键信息:
Model moved to NPU (Ascend 910)
Input shape: torch.Size([1, 3, 224, 224])
Warming up...
Running inference...
=== Results ===
Device: NPU