Sapiens2 是一系列高分辨率视觉 transformer 模型,在10 亿张人类图像上进行了预训练,专为以人为中心的任务而设计,例如姿态估计、身体部位分割、表面法线和点图绘制。
本仓库为索引仓库:每个模型变体均位于其独立的模型仓库中(链接见下文)。
| 模型 | 参数数量 | 仓库 |
|---|---|---|
| Sapiens2-0.1B | 0.114 B | facebook/sapiens2-pretrain-0.1b |
| Sapiens2-0.4B | 0.398 B | facebook/sapiens2-pretrain-0.4b |
| Sapiens2-0.8B | 0.818 B | facebook/sapiens2-pretrain-0.8b |
| Sapiens2-1B | 1.462 B | facebook/sapiens2-pretrain-1b |
| Sapiens2-1B (4K) | 1.607 B | facebook/sapiens2-pretrain-1b-4k |
| Sapiens2-5B | 5.071 B | facebook/sapiens2-pretrain-5b |
| 模型 | 仓库 |
|---|---|
| Sapiens2-0.4B | facebook/sapiens2-pose-0.4b |
| Sapiens2-0.8B | facebook/sapiens2-pose-0.8b |
| Sapiens2-1B | facebook/sapiens2-pose-1b |
| Sapiens2-5B | facebook/sapiens2-pose-5b |
| 模型 | 代码库 |
|---|---|
| Sapiens2-0.4B | facebook/sapiens2-seg-0.4b |
| Sapiens2-0.8B | facebook/sapiens2-seg-0.8b |
| Sapiens2-1B | facebook/sapiens2-seg-1b |
| Sapiens2-5B | facebook/sapiens2-seg-5b |
| 模型 | 代码库 |
|---|---|
| Sapiens2-0.4B | facebook/sapiens2-normal-0.4b |
| Sapiens2-0.8B | facebook/sapiens2-normal-0.8b |
| Sapiens2-1B | facebook/sapiens2-normal-1b |
| Sapiens2-5B | facebook/sapiens2-normal-5b |
| 模型 | 代码库 |
|---|---|
| Sapiens2-0.4B | facebook/sapiens2-pointmap-0.4b |
| Sapiens2-0.8B | facebook/sapiens2-pointmap-0.8b |
| Sapiens2-1B | facebook/sapiens2-pointmap-1b |
| Sapiens2-5B | facebook/sapiens2-pointmap-5b |
根据Sapiens2 许可证发布。
@article{khirodkarsapiens2,
title={Sapiens2},
author={Khirodkar, Rawal and Wen, He and Martinez, Julieta and Dong, Yuan and Su, Zhaoen and Saito, Shunsuke},
journal={arXiv preprint arXiv:2604.21681},
year={2026}
}