ConvNeXtV2 Femto 是一种高效的卷积神经网络图像分类模型,参数量约 5M,输入尺寸 224x224,在 ImageNet-1K 上预训练。
| 组件 | 版本 |
|---|---|
| NPU | Ascend 910 |
| PyTorch | 2.9.0 |
| torch_npu | 2.9.0.post1 |
| transformers | 4.57.6 |
| Python | 3.10 |
python3 inference.py推理脚本会自动加载模型并在 NPU 上执行推理。
推理结果示例:
| 指标 | 数值 |
|---|---|
| Batch=1 平均推理时间 | 4.51 ms |
| Batch=1 吞吐量 | 221.84 samples/s |
| Batch=2 平均推理时间 | 4.34 ms |
| Batch=2 吞吐量 | 460.72 samples/s |
Ascend NPU 精度评测
NPU vs CPU 精度对比(CPU 为基线,NPU 为验证目标):
| 指标 | 数值 |
|---|---|
| 测试用例数 | 1 (ImageNet val2017 sample) |
| 最大 logits 差异 | 0.01827 |
| 预测一致性 | Top-1 和 Top-5 完全一致 |
| 精度要求 | NPU vs CPU 最大 logits 误差 < 1% |
| 精度结论 | 一致(Top-1/5 完全一致,差异为 NPU 浮点精度特性) |
精度评测源代码和日志详见 eval/ 目录。