![]() | ![]() |
![]() | ![]() |
LTX2.3-ICEdit-Insight 是由 JoyFox Lab 开发的任务感知型视频修复与编辑模型系列,构建于 LTX-2.3 DiT 音视频基础模型 之上。
本版本聚焦于四大实用视频编辑方向:
与传统帧级增强流水线不同,该模型系列在视频潜在空间中作为 生成式视频修复系统 运行。其设计旨在重建缺失或退化视觉内容的同时,保留全局结构、相机运动、物体身份及时间一致性。
项目链接:GitHub 项目 | JoyFox Hugging Face 主页
| 文件 | 用途 |
|---|---|
ltx-2.3-edit-insight-dev-fp8.safetensors | LTX-2.3 编辑任务统一 Insight 基础 checkpoint |
ltx2.3-video-restoration-general.safetensors | 视频修复、 artifact 清理、模糊与噪声恢复 |
ltx2.3-ic-video-upscale-general.safetensors | 视频高清增强、超分辨率及细节恢复 |
ltx2.3-ic-watermark-remove-general.safetensors | 水印去除与遮挡感知重建 |
ltx2.3-ic-subtitles-remove-general.safetensors | 字幕去除与文字叠加层清理 |
| 视频修复 | 视频高清增强 |
![]() | ![]() |
| 水印去除 | 字幕去除 |
![]() | ![]() |
| 视频修复 | 视频高清增强 |
![]() | ![]() |
| 水印去除 | 字幕去除 |
![]() | ![]() |
请从项目根目录运行所有脚本。
bash run_restoration.sh
bash run_hd.sh
bash run_hd.sh /path/to/input.mp4
bash run_watermark_rm.sh
bash run_watermark_rm.sh /path/to/input.mp4
bash run_subtitle_rm.sh
bash run_subtitle_rm.sh /path/to/input.mp4PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True \
python run_pipeline.py \
--mode restoration \
--video ./inputs/input_480p.mp4 \
--prompt "Convert the video to ultra-high-definition quality while removing artifacts and rebuilding high-frequency details." \
--output ./outputs/output_restoration.mp4 \
--height 1184 --width 704 --num-frames 97 \
--fps 24.0 --seed 42 \
--sigma-profile workflow \
--streaming-prefetch-count 2 \
--model-checkpoint ./models/checkpoints/ltx-2.3-edit-insight-dev-fp8.safetensors \
--lora ./models/loras/ltx2.3-train/ltx2.3-video-restoration-general.safetensorsPYTORCH_CUDA_ALLOC_CONF=expandable_segments:True \
python run_pipeline.py \
--mode hd \
--video ./inputs/input_480p.mp4 \
--prompt "Convert the video to ultra-high-definition quality, significantly improving clarity, fine detail richness, texture fidelity, and overall perceptual sharpness." \
--output ./outputs/output_hd.mp4 \
--height 1184 --width 704 --num-frames 97 \
--fps 24.0 --seed 42 \
--sigma-profile workflow \
--streaming-prefetch-count 2 \
--model-checkpoint ./models/checkpoints/ltx-2.3-edit-insight-dev-fp8.safetensors \
--lora ./models/loras/ltx2.3-train/ltx2.3-ic-video-upscale-general.safetensorsPYTORCH_CUDA_ALLOC_CONF=expandable_segments:True \
python run_pipeline.py \
--mode watermark_rm \
--video ./inputs/input_480p.mp4 \
--prompt "Remove short-video platform watermarks and related occlusions from the video, restoring a clean, clear, and natural original image." \
--output ./outputs/output_watermark_rm.mp4 \
--height 1184 --width 704 --num-frames 97 \
--fps 24.0 --seed 1546 \
--sigma-profile workflow \
--streaming-prefetch-count 2 \
--model-checkpoint ./models/checkpoints/ltx-2.3-edit-insight-dev-fp8.safetensors \
--lora ./models/loras/ltx2.3-train/ltx2.3-ic-watermark-remove-general.safetensorsPYTORCH_CUDA_ALLOC_CONF=expandable_segments:True \
python run_pipeline.py \
--mode subtitle_rm \
--video ./inputs/input_480p.mp4 \
--prompt "Remove subtitles, captions, and related text occlusions from the video, restoring a clean and natural underlying image." \
--output ./outputs/output_subtitle_rm.mp4 \
--height 1184 --width 704 --num-frames 97 \
--fps 24.0 --seed 42 \
--sigma-profile workflow \
--streaming-prefetch-count 2 \
--model-checkpoint ./models/checkpoints/ltx-2.3-edit-insight-dev-fp8.safetensors \
--lora ./models/loras/ltx2.3-train/ltx2.3-ic-subtitles-remove-general.safetensors我们为 LTX2.3 引入了任务感知型 IC-Edit 训练框架,其中每个修复方向都通过专用的指令条件和任务特定的 IC-LoRA 适配器进行优化。
该模型的训练不仅旨在提升视觉质量,还致力于理解不同修复任务背后的编辑目标,包括水印去除、字幕清理、受损区域恢复以及高清增强。
该模型系列构建于 LTX-2.3 基础架构之上,这是一种扩散变换器视频模型,专为高保真图像到视频及视频生成工作流而设计。
我们的适配针对视频修复,通过改进以下方面实现:
视频修复不仅需要强大的单帧质量。我们对时间一致性进行优化,确保修复区域在相邻帧之间保持稳定。
这减少了常见的伪影,例如:
训练课程涵盖了真实的视频缺陷,包括:
这提高了在短视频、社交媒体片段、手机素材、下载视频和压缩制作素材上的泛化能力。
针对水印和字幕去除,该模型经过优化,能够重建遮挡区域背后隐藏的视觉内容。
它不是对目标区域进行涂抹或模糊处理,而是利用周围的空间上下文和时间线索来推断合理的背景结构、物体边界、光照和纹理连续性。
在高清增强方面,该模型通过频率感知修复训练提升了感知锐度和精细视觉细节。
这对于恢复以下内容尤其有帮助:
该模型系列由JoyFox Lab(成都玄狐科技有限公司)训练和优化。
训练流程包括:
如需研究合作、商业授权或工作流集成,请联系:
z@vvicat.com基于Apache 2.0许可证授权。
使用或再分发衍生检查点时,还请同时查阅上游LTX-2.3基础模型的许可条款。