LTX-2.3 22B IC-LoRA HDR

这是在LTX-2.3-22b基础上训练的IC-LoRA，可使LTX模型生成16位高动态范围内容。它支持文本/图像驱动的内容生成，以及从8位SDR到16位HDR的视频转换。

该模型基于LTX-2基础模型构建。

论文： LumiVid: HDR Video Generation via Latent Alignment with Logarithmic Encoding
代码： GitHub 仓库
项目页面： LumiVid HDR 项目页面

什么是上下文内LoRA（IC LoRA）？

IC LoRA能够在推理时基于参考视频帧对视频生成进行条件控制，从而在文本到视频基础模型之上实现精细的视频到视频控制。它还允许将初始图像用于图像到视频转换，并生成视听输出。

什么是参考缩小因子？

IC LoRA使用参考控制信号，即与生成视频位置对齐并包含上下文参考的视频。为提高效率，参考视频可以更小，从而减少 token 消耗。参考缩小因子决定了参考视频相对于生成分辨率的预期缩小比例。为表明预期的参考尺寸，检查点名称中会包含“ref”分母，后跟相对于输出分辨率的比例。

模型文件

ltx-2.3-22b-ic-lora-hdr-x.x.safetensors

许可证

详见LTX-2-community-license以获取完整条款。

模型详情

基础模型： LTX-2.3-22b Video
训练类型： IC LoRA
控制类型： HDR 生成启用
参考缩小因子： 1（参考分辨率为输出分辨率的1倍）
流水线详情： 为在正常数值范围内实现16位动态范围，生成前后分别使用LogC3变换和逆变换。

🔌 在 ComfyUI 中使用

将 LoRA 权重复制到 models/loras 目录。
使用 LTX-2 ComfyUI 仓库中的官方 IC-LoRA 工作流。
确保使用支持参考下采样因子的节点：LTXICLoRALoaderModelOnly 用于加载 LoRA 并提取下采样因子，LTXAddVideoICLoRAGuide 用于添加小潜变量作为引导。

数据集

该模型使用专有 HDR 数据集进行训练。

引用

@article{hacohen2025ltx2,
  title={LTX-2: Efficient Joint Audio-Visual Foundation Model},
  author={HaCohen, Yoav and Brazowski, Benny and Chiprut, Nisan and Bitterman, Yaki and Kvochko, Andrew and Berkowitz, Avishai and Shalem, Daniel and Lifschitz, Daphna and Moshe, Dudu and Porat, Eitan and others},
  journal={arXiv preprint arXiv:2601.03233},
  year={2025}
}
@misc{LTXVideoTrainer2025,
  title={LTX-Video Community Trainer},
  author={Matan Ben Yosef and Naomi Ken Korem and Tavi Halperin},
  year={2025},
  publisher={GitHub},
}

致谢

基础模型由Lightricks提供
训练基础设施：LTX-2 Community Trainer

LTX-2.3 22B IC-LoRA HDR

这是在LTX-2.3-22b基础上训练的IC-LoRA，可使LTX模型生成16位高动态范围内容。它支持文本/图像驱动的内容生成，以及从8位SDR到16位HDR的视频转换。

该模型基于LTX-2基础模型构建。

什么是参考缩小因子？

模型详情

基础模型： LTX-2.3-22b Video

训练类型： IC LoRA

控制类型： HDR 生成启用

参考缩小因子： 1（参考分辨率为输出分辨率的1倍）

流水线详情： 为在正常数值范围内实现16位动态范围，生成前后分别使用LogC3变换和逆变换。

🔌 在 ComfyUI 中使用

将 LoRA 权重复制到 models/loras 目录。

使用 LTX-2 ComfyUI 仓库中的官方 IC-LoRA 工作流。

确保使用支持参考下采样因子的节点：LTXICLoRALoaderModelOnly 用于加载 LoRA 并提取下采样因子，LTXAddVideoICLoRAGuide 用于添加小潜变量作为引导。

引用

@article{hacohen2025ltx2,
  title={LTX-2: Efficient Joint Audio-Visual Foundation Model},
  author={HaCohen, Yoav and Brazowski, Benny and Chiprut, Nisan and Bitterman, Yaki and Kvochko, Andrew and Berkowitz, Avishai and Shalem, Daniel and Lifschitz, Daphna and Moshe, Dudu and Porat, Eitan and others},
  journal={arXiv preprint arXiv:2601.03233},
  year={2025}
}
@misc{LTXVideoTrainer2025,
  title={LTX-Video Community Trainer},
  author={Matan Ben Yosef and Naomi Ken Korem and Tavi Halperin},
  year={2025},
  publisher={GitHub},
}