这是 LTX-2.3 模型的 FP8 版本。以下所有信息均源自基础模型。
本模型卡片聚焦于 LTX-2.3 模型,它是 LTX-2 模型 的重大更新,在音频和视觉质量以及提示词遵循度方面均有提升。 LTX-2 在论文 LTX-2: Efficient Joint Audio-Visual Foundation Model 中进行了介绍。
💻💻 如果您想直接查看代码 - 代码已在 此处 提供。 💾💾
LTX-2.3 是一个基于 DiT 的音视频基础模型,旨在通过单一模型生成同步的视频和音频。它汇集了现代视频生成的核心构建模块,提供开放权重,并专注于实用的本地执行。
| 名称 | 说明 |
|---|---|
| ltx-2.3-22b-dev-fp8 | 完整模型,灵活且可训练,fp8 格式 |
| ltx-2.3-22b-distilled-fp8 | 完整模型的蒸馏版本,8 步,CFG=1,fp8 格式 |
可通过 API playground 立即体验 LTX-2.3。
您可以根据 许可协议 将模型(完整模型、蒸馏模型、超分辨率模型以及任何模型衍生物)用于许可范围内的用途。
我们建议您使用可在 ComfyUI Manager 中找到的内置 LTXVideo 节点。 有关手动安装信息,请参阅我们的 文档网站。
LTX-2 代码库 是一个包含多个软件包的单体仓库。从 'ltx-core' 中的模型定义,到 'ltx-pipelines' 中的管道,再到 'ltx-trainer' 中的训练功能,一应俱全。 该代码库已在 Python >=3.12、CUDA 版本 >12.7 的环境中测试通过,并支持 PyTorch ~= 2.7。
git clone https://github.com/Lightricks/LTX-2.git
cd LTX-2
# From the repository root
uv sync
source .venv/bin/activate要使用我们的模型,请按照 ltx-pipelines 软件包中的说明操作。
Diffusers Python 库 对 LTX-2.3 的支持即将推出!
目前建议训练 bf16 模型。欢迎社区贡献 fp8 模型的训练方法。
@article{hacohen2025ltx2,
title={LTX-2: Efficient Joint Audio-Visual Foundation Model},
author={HaCohen, Yoav and Brazowski, Benny and Chiprut, Nisan and Bitterman, Yaki and Kvochko, Andrew and Berkowitz, Avishai and Shalem, Daniel and Lifschitz, Daphna and Moshe, Dudu and Porat, Eitan and Richardson, Eitan and Guy Shiran and Itay Chachy and Jonathan Chetboun and Michael Finkelson and Michael Kupchick and Nir Zabari and Nitzan Guetta and Noa Kotler and Ofir Bibi and Ori Gordon and Poriya Panet and Roi Benita and Shahar Armon and Victor Kulikov and Yaron Inger and Yonatan Shiftan and Zeev Melumian and Zeev Farbman},
journal={arXiv preprint arXiv:2601.03233},
year={2025}
}