HunyuanWorld-Mirror 是一个功能强大的前馈模型,用于全面的三维几何预测。它集成了多种几何先验(相机位姿、标定内参、深度图),并能在单次前向传播中同时生成多种三维表示(点云、多视角深度、相机参数、表面法向量、三维高斯)。
HunyuanWorld-Mirror 包含两个关键组件:
(1) 多模态先验提示:一种将多种先验模态(包括标定内参、相机位姿和深度)嵌入到前馈模型中的机制。给定任意可用先验子集,我们利用多个轻量级编码层将每种模态转换为结构化 tokens。
(2) 通用几何预测:一种统一架构,能够处理从相机与深度估计到点图回归、表面法向量估计以及新视角合成的全谱系三维重建任务。
如果您发现HunyuanWorld-Mirror对您的研究和应用有所帮助,请使用以下BibTeX进行引用:
@article{liu2025worldmirror,
title={WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting},
author={Liu, Yifan and Min, Zhiyuan and Wang, Zhenwei and Wu, Junta and Wang, Tengfei and Yuan, Yixuan and Luo, Yawei and Guo, Chunchao},
journal={arXiv preprint arXiv:2510.10726},
year={2025}
}我们衷心感谢 VGGT、Fast3R、CUT3R 和 DUSt3R 的作者及贡献者,感谢他们出色的开源工作和开创性研究。