HuggingFace镜像/OpenVoiceV2
模型介绍文件和版本分析
下载使用量0

OpenVoice V2

myshell-ai%2FOpenVoice | Trendshift

2024年4月,我们发布了OpenVoice V2版本,该版本包含V1版本的所有功能,并具有以下特点:

  1. 更优的音频质量。OpenVoice V2采用不同的训练策略,以提供更高质量的音频。

  2. 原生多语言支持。OpenVoice V2原生支持英语、西班牙语、法语、中文、日语和韩语。

  3. 免费商业使用。自2024年4月起,V2和V1版本均遵循MIT许可协议发布。商业使用免费。

特点

  • 精准音色克隆。 OpenVoice能够准确克隆参考音色,并以多种语言和口音生成语音。
  • 灵活的语音风格控制。 OpenVoice允许对语音风格进行细致控制,包括情感和口音,以及其他风格参数,包括节奏、停顿和语调。
  • 零样本跨语种语音克隆。 生成的语音的语言和参考语音的语言无需在大型多语种训练数据集中展示。

使用方法

请参阅使用说明获取详细指导。

使用方法

目录

  • 快速使用:直接使用OpenVoice,无需安装。
  • Linux安装:仅适用于熟悉Linux、Python和PyTorch的开发者和研究人员。
    • V1
    • V2
  • 在其他平台上的安装:由社区贡献的非官方安装指南

快速使用

OpenVoice的输入语音音频可以是任何语言。OpenVoice可以克隆该语音音频中的声音,并使用该声音以多种语言进行说话。为了快速使用,我们建议您尝试已经部署的服务:

  • 英式英语
  • 美式英语
  • 印式英语
  • 澳式英语
  • 西班牙语
  • 法语
  • 中文
  • 日语
  • 韩语

Linux安装

本部分仅适用于熟悉Linux、Python和PyTorch的开发者和研究人员。克隆此仓库,并运行

conda create -n openvoice python=3.9
conda activate openvoice
git clone git@github.com:myshell-ai/OpenVoice.git
cd OpenVoice
pip install -e .

无论您使用的是V1版本还是V2版本,上述安装步骤都是相同的。

OpenVoice V1

请从这里下载检查点文件,并将其解压至checkpoints文件夹。

1. 灵活的语音风格控制。 请参考demo_part1.ipynb,了解OpenVoice如何实现克隆语音风格的灵活控制。

2. 跨语种语音克隆。 请参考demo_part2.ipynb,了解如何在MSML训练集中出现的语言或未出现的语言上进行示例操作。

3. Gradio演示。 这里提供了一个简约的本地Gradio演示。我们强烈建议用户遇到Gradio演示问题时,查阅demo_part1.ipynb、demo_part2.ipynb以及问答。您可以通过python -m openvoice_app --share命令启动本地Gradio演示。

OpenVoice V2

请从这里下载检查点文件,并将其解压至checkpoints_v2文件夹。

安装MeloTTS:

pip install git+https://github.com/myshell-ai/MeloTTS.git
python -m unidic download

示例用法。 请查看 demo_part3.ipynb 以了解 OpenVoice V2 的示例用法。现在它原生支持英语、西班牙语、法语、中文、日语和韩语。

在其他平台上安装

本节提供了由社区开源贡献者编写的非官方安装指南:

  • Windows
    • 由 @Alienpups 编写的指南
    • 如果您有更好的安装指南,欢迎贡献。我们将会在此处列出您的信息。
  • Docker
    • 由 @StevenJSCF 编写的指南
    • 如果您有更好的安装指南,欢迎贡献。我们将会在此处列出您的信息。

链接

  • GitHub
  • HFDemo
  • Discord