timm/convnext_large_mlp.clip_laion2b_augreg_ft_in1k - 昇腾NPU适配

1. 模型概述

带MLP头部的ConvNeXt Large模型，使用CLIP在LAION-2B数据集上进行预训练并采用增强正则化，随后在ImageNet-1k数据集上以256x256分辨率进行微调。

原始模型：timm/convnext_large_mlp.clip_laion2b_augreg_ft_in1k
架构：ConvNeXt Large（MLP头部）
参数：200,128,168
输入分辨率：256x256
输出类别：1000

2. NPU适配

设备：昇腾NPU（npu:0）
框架：PyTorch + torch_npu

3. 精度

指标	数值
余弦相似度	0.999970
最大绝对误差	0.017619

4. 延迟

设备	平均延迟
NPU（npu:0）	19.83 ms

5. CPU与NPU对比

指标	CPU	NPU
输出形状	[1, 1000]	[1, 1000]
预测结果	21	21

6. 使用方法

source setup_env.sh
HF_ENDPOINT=https://hf-mirror.com python3 inference.py --device npu:0