合并请求 - ViT-B-16-SigLIP-512-npu:可用于图像特征提取、图文检索及零样本分类任务。基于 ViT-Base 架构的 SigLIP 多模态视觉模型,采用 Sigmoid 损失函数训练,适配昇腾 NPU,推理加速比达 177.31x,精度与 CPU 高度一致。【此简介由AI生成】 - AtomGit AI社区