带MLP头部的ConvNeXt Large模型,使用CLIP在LAION-2B数据集上进行预训练并采用增强正则化,随后在ImageNet-1k数据集上以256x256分辨率进行微调。
| 指标 | 数值 |
|---|---|
| 余弦相似度 | 0.999970 |
| 最大绝对误差 | 0.017619 |
| 设备 | 平均延迟 |
|---|---|
| NPU(npu:0) | 19.83 ms |
| 指标 | CPU | NPU |
|---|---|---|
| 输出形状 | [1, 1000] | [1, 1000] |
| 预测结果 | 21 | 21 |
source setup_env.sh
HF_ENDPOINT=https://hf-mirror.com python3 inference.py --device npu:0