SAM 3.1

SAM 3（Segment Anything with Concepts）是 Meta 推出的一款统一基础模型，用于图像和视频中的可提示分割。它能够通过文本或视觉提示（如点、框和掩码）对目标进行检测、分割和跟踪。SAM 3 引入了对由短文本短语指定的开放词汇概念的所有实例进行详尽分割的能力，可处理的独特概念数量是现有基准测试的 50 倍以上。SAM 3.1 在此基础上新增了 Object Multiplex——一种用于联合多目标跟踪的共享内存方法，在单个 H100 GPU 上处理 128 个目标时，推理速度提升约 7 倍，同时不损失精度，并且在 7 项基准测试中的 6 项上均提高了视频目标分割（VOS）性能。

本仓库仅托管 SAM 3.1 模型检查点，不包含 Hugging Face Transformers 集成。有关安装、代码、使用示例和完整文档，请访问 SAM 3 GitHub 仓库。

SAM 3.1

本仓库仅托管 SAM 3.1 模型检查点，不包含 Hugging Face Transformers 集成。有关安装、代码、使用示例和完整文档，请访问 SAM 3 GitHub 仓库。