2024年4月,我们发布了OpenVoice V2版本,该版本包含V1版本的所有功能,并具有以下特点:
更优的音频质量。OpenVoice V2采用不同的训练策略,以提供更高质量的音频。
原生多语言支持。OpenVoice V2原生支持英语、西班牙语、法语、中文、日语和韩语。
免费商业使用。自2024年4月起,V2和V1版本均遵循MIT许可协议发布。商业使用免费。
请参阅使用说明获取详细指导。
OpenVoice的输入语音音频可以是任何语言。OpenVoice可以克隆该语音音频中的声音,并使用该声音以多种语言进行说话。为了快速使用,我们建议您尝试已经部署的服务:
本部分仅适用于熟悉Linux、Python和PyTorch的开发者和研究人员。克隆此仓库,并运行
conda create -n openvoice python=3.9
conda activate openvoice
git clone git@github.com:myshell-ai/OpenVoice.git
cd OpenVoice
pip install -e .无论您使用的是V1版本还是V2版本,上述安装步骤都是相同的。
请从这里下载检查点文件,并将其解压至checkpoints文件夹。
1. 灵活的语音风格控制。
请参考demo_part1.ipynb,了解OpenVoice如何实现克隆语音风格的灵活控制。
2. 跨语种语音克隆。
请参考demo_part2.ipynb,了解如何在MSML训练集中出现的语言或未出现的语言上进行示例操作。
3. Gradio演示。 这里提供了一个简约的本地Gradio演示。我们强烈建议用户遇到Gradio演示问题时,查阅demo_part1.ipynb、demo_part2.ipynb以及问答。您可以通过python -m openvoice_app --share命令启动本地Gradio演示。
请从这里下载检查点文件,并将其解压至checkpoints_v2文件夹。
安装MeloTTS:
pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic download示例用法。 请查看 demo_part3.ipynb 以了解 OpenVoice V2 的示例用法。现在它原生支持英语、西班牙语、法语、中文、日语和韩语。
本节提供了由社区开源贡献者编写的非官方安装指南: