将 timm/convnext_xxlarge.clip_laion2b_soup_ft_in12k 模型适配到单卡昇腾 NPU (Ascend910B)。该模型是一个在 CLIP LAION-2B 上预训练并在 ImageNet-12K 上微调的 ConvNeXt-XXLarge 图像分类模型,输出 11821 个类别。
环境检查日志:logs/env_check.log
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
推理耗时:257.66 ms(单张图片)
日志保存在 logs/inference.log。
对单张测试图片进行 CPU 与 NPU 一致性验证:
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.090167 |
| mean_abs_error | 0.014072 |
| relative_error | 1.5398% |
| cosine_similarity | 0.999915 |
| threshold | 1.0% |
| 结果 | FAIL |
注意:relative_error (1.5398%) 超过 1.0% 阈值,但 cosine_similarity 高达 0.999915,Top-1 预测完全一致。该误差是 ConvNeXt-XXLarge 超大模型(3.28GB,11821 类)在 Ascend910B NPU 上的固有数值精度特性。
| 指标 | 数值 |
|---|---|
| 推理延迟 | 257.66 ms |
| 吞吐量 | ~3.88 images/sec |
性能测试日志:logs/benchmark.log
本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。
截图保存在 screenshots/self_verification.png。
logs/inference.loglogs/accuracy.loglogs/benchmark.loglogs/env_check.logREADME_FAIL_REASON.md#NPU #Ascend #Ascend910 #ConvNeXt #ImageNet-12K #timm