分离的 LTX2.3 检查点,用于在 Comfy 中以替代方式加载模型

fp8 量化采用基本静态权重缩放完成,且设置为不使用 fp8 矩阵乘法运行。标有 input_scaled 的模型额外具有激活缩放功能,并设置为在支持的硬件(大致为 40xx 及更高版本的 Nvidia GPU)上使用 fp8 矩阵乘法运行。
由于这是我首次尝试校准输入缩放,这些模型具有较强的实验性,但从结果来看似乎可行。这是在 4090 上进行的测试,使用 distill 进行 8 步处理:
更新: input_scaled_v3 遵循官方版本的相同模式,其中块 0-1 和 46-47(前两个和后两个)保持为 bf16 格式,并且输入缩放校准更佳。这确实修复了 v2 中的一些问题,尤其是在使用输入音频时。
Tiny VAE 由 madebyollin 提供
目前可按如下方式使用:
