tencent_hunyuan
/
Unified_Audio_Schema
like
0
添加到合集
音频转文本生成
Transformers
Safetensors
英文
汉语
license-term-of-unified-audio-schema
ASR
music
audio-captioning
audio-understanding
audio
speech
audio-language-model
audio-llm
text-to-speech
sound
multimodal
speech-to-text
TTS
arxiv:2604.12506
arxiv:2604.1250
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
0/100
全部分类
0
Label
状态
排序
📭
暂无数据
讨论列表 - Unified_Audio_Schema:可用于音频理解与生成任务,如语音/文本对话、ASR、音频描述及TTS。该项目提供基于Unified Audio Schema框架训练的模型 checkpoint,支持文本与音频交织输入输出,实现灵活的多模态交互,在多项音频基准测试中表现优异。【此简介由AI生成】 - AtomGit AI社区