HuggingFace镜像/LTX-2.3-22b-IC-LoRA-HDR
模型介绍文件和版本分析
下载使用量0

LTX-2.3 22B IC-LoRA HDR

这是在LTX-2.3-22b基础上训练的IC-LoRA,可使LTX模型生成16位高动态范围内容。它支持文本/图像驱动的内容生成,以及从8位SDR到16位HDR的视频转换。

该模型基于LTX-2基础模型构建。

  • 论文: LumiVid: HDR Video Generation via Latent Alignment with Logarithmic Encoding
  • 代码: GitHub 仓库
  • 项目页面: LumiVid HDR 项目页面

什么是上下文内LoRA(IC LoRA)?

IC LoRA能够在推理时基于参考视频帧对视频生成进行条件控制,从而在文本到视频基础模型之上实现精细的视频到视频控制。 它还允许将初始图像用于图像到视频转换,并生成视听输出。

什么是参考缩小因子?

IC LoRA使用参考控制信号,即与生成视频位置对齐并包含上下文参考的视频。 为提高效率,参考视频可以更小,从而减少 token 消耗。 参考缩小因子决定了参考视频相对于生成分辨率的预期缩小比例。 为表明预期的参考尺寸,检查点名称中会包含“ref”分母,后跟相对于输出分辨率的比例。

模型文件

ltx-2.3-22b-ic-lora-hdr-x.x.safetensors

许可证

详见LTX-2-community-license以获取完整条款。

模型详情

  • 基础模型: LTX-2.3-22b Video
  • 训练类型: IC LoRA
  • 控制类型: HDR 生成启用
  • 参考缩小因子: 1(参考分辨率为输出分辨率的1倍)
  • 流水线详情: 为在正常数值范围内实现16位动态范围,生成前后分别使用LogC3变换和逆变换。

🔌 在 ComfyUI 中使用

  1. 将 LoRA 权重复制到 models/loras 目录。
  2. 使用 LTX-2 ComfyUI 仓库 中的官方 IC-LoRA 工作流。
  3. 确保使用支持参考下采样因子的节点:LTXICLoRALoaderModelOnly 用于加载 LoRA 并提取下采样因子,LTXAddVideoICLoRAGuide 用于添加小潜变量作为引导。

数据集

该模型使用专有 HDR 数据集进行训练。

引用

@article{hacohen2025ltx2,
  title={LTX-2: Efficient Joint Audio-Visual Foundation Model},
  author={HaCohen, Yoav and Brazowski, Benny and Chiprut, Nisan and Bitterman, Yaki and Kvochko, Andrew and Berkowitz, Avishai and Shalem, Daniel and Lifschitz, Daphna and Moshe, Dudu and Porat, Eitan and others},
  journal={arXiv preprint arXiv:2601.03233},
  year={2025}
}
@misc{LTXVideoTrainer2025,
  title={LTX-Video Community Trainer},
  author={Matan Ben Yosef and Naomi Ken Korem and Tavi Halperin},
  year={2025},
  publisher={GitHub},
}

致谢

  • 基础模型由Lightricks提供
  • 训练基础设施:LTX-2 Community Trainer