HuggingFace镜像/LTX-2.3-22b-IC-LoRA-LipDub
模型介绍文件和版本分析

LTX-2.3 22B IC-LoRA LipDub

这是在 LTX-2.3-22b 基础上训练的 IC-LoRA,能够在 LTX 模型上实现唇形同步配音功能。

它基于 LTX-2 基础模型构建。

  • 项目页面: JustDubIt 项目页面
  • 论文: JustDubIt 论文
  • 代码: GitHub 仓库
  • 推理流水线: packages/ltx-pipelines/src/ltx_pipelines/lipdub.py

模型文件

ltx-2.3-22b-ic-lora-lipdub-0.9.safetensors

许可证

完整条款请参见 LTX-2-community-license。

模型详情

  • 基础模型: LTX-2.3
  • 训练类型: IC-LoRA
  • 控制类型: 视频和音频
  • 参考图像下采样因子: 1(参考图像分辨率与输出分辨率相同)

🔌 在 ComfyUI 中使用

  1. 将 LoRA 权重复制到 models/loras 目录。
  2. 使用 LTX-2 ComfyUI 仓库 中的官方唇形同步配音工作流。

数据集

该模型使用唇形同步配音数据集进行训练。

引用

@article{chen2026just,
  title={JUST-DUB-IT: Video Dubbing via Joint Audio-Visual Diffusion},
  author={Chen, Anthony and Korem, Naomi Ken and Zeevi, Gal and Halperin, Tavi and Yosef, Matan Ben and Jelercic, Urska and Bibi, Ofir and Patashnik, Or and Cohen-Or, Daniel},
  journal={arXiv preprint arXiv:2601.22143},
  year={2026}
}

致谢

  • 基础模型由Lightricks提供
  • 训练基础设施:LTX-2 Community Trainer
下载使用量0