jd-opensource
/
JoyAI-Echo
like
19
添加到合集
文本生成视频
Transformers
Diffusers
Safetensors
ltx-2-community-license-agreement
video-generation
dmd
long-video
multi-shot
audio-video-generation
0/100
全部分类
0
Label
状态
排序
讨论列表 - JoyAI-Echo:JoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。 - AtomGit AI社区
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发