Facebook推出的MMS模型拥有10亿参数规模。
MMS是Facebook AI研发的大规模多语言语音预训练模型("MMS")。
该模型采用Wav2Vec2的自监督训练目标,基于超过1,400种语言、约50万小时的语音数据进行预训练。
使用本模型时,请确保语音输入采样率为16kHz。
注意:该模型需在下游任务(如自动语音识别、翻译或分类)上进行微调。关于语音识别的微调细节,请查阅微调指南章节或技术博客。
即将上线...
开发团队: Vineel Pratap 等
模型类型: 多语言自动语音识别模型
支持语言: 1000+ 种语言
许可协议: CC-BY-NC 4.0 许可证
参数量: 10亿
引用格式:
@article{pratap2023mms,
title={Scaling Speech Technology to 1,000+ Languages},
author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
journal={arXiv},
year={2023}
}