HuggingFace镜像/sapiens2
模型介绍文件和版本分析
下载使用量0

Sapiens2

Sapiens2 是一系列高分辨率视觉 transformer 模型,在10 亿张人类图像上进行了预训练,专为以人为中心的任务而设计,例如姿态估计、身体部位分割、表面法线和点图绘制。

本仓库为索引仓库:每个模型变体均位于其独立的模型仓库中(链接见下文)。

  • 📄 论文:arXiv:2604.21681
  • 🌐 项目页面:rawalkhirodkar.github.io/sapiens2
  • 💻 代码:github.com/facebookresearch/sapiens2
  • 📚 模型集合:Sapiens2 on HuggingFace

预训练骨干网络

模型参数数量仓库
Sapiens2-0.1B0.114 Bfacebook/sapiens2-pretrain-0.1b
Sapiens2-0.4B0.398 Bfacebook/sapiens2-pretrain-0.4b
Sapiens2-0.8B0.818 Bfacebook/sapiens2-pretrain-0.8b
Sapiens2-1B1.462 Bfacebook/sapiens2-pretrain-1b
Sapiens2-1B (4K)1.607 Bfacebook/sapiens2-pretrain-1b-4k
Sapiens2-5B5.071 Bfacebook/sapiens2-pretrain-5b

任务检查点

姿态估计

模型仓库
Sapiens2-0.4Bfacebook/sapiens2-pose-0.4b
Sapiens2-0.8Bfacebook/sapiens2-pose-0.8b
Sapiens2-1Bfacebook/sapiens2-pose-1b
Sapiens2-5Bfacebook/sapiens2-pose-5b

身体部位分割

模型代码库
Sapiens2-0.4Bfacebook/sapiens2-seg-0.4b
Sapiens2-0.8Bfacebook/sapiens2-seg-0.8b
Sapiens2-1Bfacebook/sapiens2-seg-1b
Sapiens2-5Bfacebook/sapiens2-seg-5b

表面法向量估计

模型代码库
Sapiens2-0.4Bfacebook/sapiens2-normal-0.4b
Sapiens2-0.8Bfacebook/sapiens2-normal-0.8b
Sapiens2-1Bfacebook/sapiens2-normal-1b
Sapiens2-5Bfacebook/sapiens2-normal-5b

点图估计

模型代码库
Sapiens2-0.4Bfacebook/sapiens2-pointmap-0.4b
Sapiens2-0.8Bfacebook/sapiens2-pointmap-0.8b
Sapiens2-1Bfacebook/sapiens2-pointmap-1b
Sapiens2-5Bfacebook/sapiens2-pointmap-5b

许可证

根据Sapiens2 许可证发布。

引用

@article{khirodkarsapiens2,
  title={Sapiens2},
  author={Khirodkar, Rawal and Wen, He and Martinez, Julieta and Dong, Yuan and Su, Zhaoen and Saito, Shunsuke},
  journal={arXiv preprint arXiv:2604.21681},
  year={2026}
}