将 timm/convnext_base.clip_laion2b_augreg_ft_in12k 图片分类模型适配到单卡昇腾 NPU(Ascend910)。
该模型来源于 CLIP/LAION 预训练,经 OpenCLIP 流程微调为图片分类头输出,类别数为 11821。
pip install -r requirements.txt
python inference.py推理结果 (NPU Top-5):
日志保存在 logs/inference.log。
python eval_accuracy.py推理结果(单张测试图片):
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.016425 |
| mean_abs_error | 0.003875 |
| relative_error | 0.4262% |
| cosine_similarity | 0.999993 |
| threshold | 1.0% |
| 结果 | PASS |
python benchmark.pySmoke 测试表明 CPU 与 NPU 输出 logits 高度一致,Top-1/Top-5 预测完全相同。
见 screenshots/self_verification.png 与 screenshots/self_verification.txt。
logs/env_check.log — 环境检查logs/inference.log — NPU 推理结果logs/accuracy.log — CPU-NPU 一致性对比logs/benchmark.log — 性能基准.safetensors/.bin/.pth)已加入 .gitignore,不提交到仓库。#NPU #Ascend #ModelScope #timm #ConvNeXt #CLIP #image-classification