LTX-2.3-nvfp4:可用于生成同步的视频和音频，支持图像到视频、文本到视频等多种任务。该项目是基于 DiT 的音视频基础模型，具备开放权重，注重本地执行，能提升音视频质量和 prompt 遵循度。【此简介由AI生成】 - AtomGit AI社区

LTX-2.3 NVFP4 模型卡片

这是 LTX-2.3 模型的 NVFP4 版本。以下所有信息均源自基础模型。

本模型卡片聚焦于 LTX-2.3 模型，它是 LTX-2 模型的重大更新，在音频和视觉质量以及提示词遵循度方面均有提升。 LTX-2 在论文 LTX-2: Efficient Joint Audio-Visual Foundation Model 中进行了介绍。

💻💻 如果您想直接查看代码 - 代码已在此处提供。 💾💾

LTX-2.3 是一个基于 DiT 的音视频基础模型，旨在通过单一模型生成同步的视频和音频。它整合了现代视频生成的核心构建模块，提供开放权重，并专注于实用的本地执行。

模型检查点

名称	说明
ltx-2.3-22b-dev-nvfp4	完整模型，灵活且可训练，采用 nvfp4 格式，通过量化感知蒸馏训练以提高精度
ltx-2.3-22b-distilled-nvfp4 (即将推出)	完整模型的蒸馏版本，8 步，CFG=1，采用 nvfp4 格式

模型详情

开发方： Lightricks
模型类型： 基于扩散的音视频基础模型
支持语言： 英语

在线演示

LTX-2.3 可立即通过 API playground 访问。

本地运行

直接使用许可

您可以将这些模型（完整模型、蒸馏模型、超分辨率模型以及任何模型衍生物）用于许可协议允许的用途。

ComfyUI

我们建议您使用 ComfyUI 管理器中内置的 LTXVideo 节点。有关手动安装信息，请参考我们的文档网站。

PyTorch 代码库

LTX-2 代码库是一个包含多个软件包的单体仓库。从 'ltx-core' 中的模型定义，到 'ltx-pipelines' 中的流水线，再到 'ltx-trainer' 中的训练功能，一应俱全。该代码库已在 Python >=3.12、CUDA 版本 >12.7 的环境中测试通过，并支持 PyTorch ~= 2.7。

安装

git clone https://github.com/Lightricks/LTX-2.git
cd LTX-2

# From the repository root
uv sync
source .venv/bin/activate

推理

要使用我们的模型，请按照 ltx-pipelines 软件包中的说明操作。

Diffusers 🧨

Diffusers Python 库对 LTX-2.3 的支持即将推出！

通用提示：

宽度和高度设置必须能被 32 整除。帧数必须能被 8 + 1 整除。
如果分辨率或帧数不能被 32 或 8 + 1 整除，应使用 -1 对输入进行填充，然后裁剪至所需的分辨率和帧数。
有关编写有效提示词的技巧，请访问我们的提示词指南

局限性

本模型并非旨在提供或无法提供事实信息。
作为一种统计模型，此检查点可能会放大现有的社会偏见。
模型可能无法生成与提示词完全匹配的视频。
提示词的遵循程度在很大程度上受提示词风格的影响。
模型可能会生成不适当或冒犯性的内容。
生成无语音音频时，音频质量可能较低。

训练模型

目前建议训练 bf16 模型。欢迎社区贡献 fp8 模型的训练方法。

引用

@article{hacohen2025ltx2,
  title={LTX-2: Efficient Joint Audio-Visual Foundation Model},
  author={HaCohen, Yoav and Brazowski, Benny and Chiprut, Nisan and Bitterman, Yaki and Kvochko, Andrew and Berkowitz, Avishai and Shalem, Daniel and Lifschitz, Daphna and Moshe, Dudu and Porat, Eitan and Richardson, Eitan and Guy Shiran and Itay Chachy and Jonathan Chetboun and Michael Finkelson and Michael Kupchick and Nir Zabari and Nitzan Guetta and Noa Kotler and Ofir Bibi and Ori Gordon and Poriya Panet and Roi Benita and Shahar Armon and Victor Kulikov and Yaron Inger and Yonatan Shiftan and Zeev Melumian and Zeev Farbman},
  journal={arXiv preprint arXiv:2601.03233},
  year={2025}
}