o
openMind/fastspeech2_ms
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

FastSpeech2

这是基于MindSpore实现的微软文本转语音系统FastSpeech 2:快速且高质量的端到端文本转语音。

FastSpeech 2有几个版本。 此实现与版本1更为相似,它使用F0值作为音调特征。 另一方面,后续版本使用连续小波变换提取的频谱图作为音调特征。

预训练模型

模型数据集检查点总批量大小梅尔频谱数硬件MindSpore版本
FastSpeech2(基础版)LJSpeech-1.116万个步骤321281 x Ascend1.9.0

如何开始使用模型

有关如何训练和推断模型的信息,请查阅MindAudio GitHub 仓库。

许可证

GNU通用公共许可证v2.0