void-model:可用于从视频中移除对象及其引发的物理交互(如阴影、反射、物体坠落等)。基于 CogVideoX 3D Transformer 构建,通过交互感知四值掩码调节,支持视频修复与时间一致性优化,需 40GB+ VRAM GPU运行。【此简介由AI生成】 - AtomGit AI社区