大规模多语言语音（MMS）- 10亿参数版

Facebook推出的MMS模型拥有10亿参数规模。

MMS是Facebook AI研发的大规模多语言语音预训练模型（"MMS"）。
该模型采用Wav2Vec2的自监督训练目标，基于超过1,400种语言、约50万小时的语音数据进行预训练。

使用本模型时，请确保语音输入采样率为16kHz。

注意：该模型需在下游任务（如自动语音识别、翻译或分类）上进行微调。关于语音识别的微调细节，请查阅微调指南章节或技术博客。

如何微调

即将上线...

模型详情

开发团队： Vineel Pratap 等
模型类型： 多语言自动语音识别模型
支持语言： 1000+ 种语言
许可协议： CC-BY-NC 4.0 许可证
参数量： 10亿

引用格式：

@article{pratap2023mms,
  title={Scaling Speech Technology to 1,000+ Languages},
  author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
journal={arXiv},
year={2023}
}

附加链接

大规模多语言语音（MMS）- 10亿参数版

Facebook推出的MMS模型拥有10亿参数规模。

使用本模型时，请确保语音输入采样率为16kHz。

注意：该模型需在下游任务（如自动语音识别、翻译或分类）上进行微调。关于语音识别的微调细节，请查阅微调指南章节或技术博客。

如何微调

即将上线...

模型详情

开发团队： Vineel Pratap 等
模型类型： 多语言自动语音识别模型
支持语言： 1000+ 种语言
许可协议： CC-BY-NC 4.0 许可证
参数量： 10亿

引用格式：

@article{pratap2023mms,
  title={Scaling Speech Technology to 1,000+ Languages},
  author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
journal={arXiv},
year={2023}
}

大规模多语言语音（MMS）- 10亿参数版

目录

如何微调

模型详情

附加链接

大规模多语言语音（MMS）- 10亿参数版

目录

如何微调

模型详情

附加链接