HuggingFace镜像/mms-1b
模型介绍文件和版本分析
下载使用量0

大规模多语言语音(MMS)- 10亿参数版

Facebook推出的MMS模型拥有10亿参数规模。

MMS是Facebook AI研发的大规模多语言语音预训练模型("MMS")。
该模型采用Wav2Vec2的自监督训练目标,基于超过1,400种语言、约50万小时的语音数据进行预训练。

使用本模型时,请确保语音输入采样率为16kHz。

注意:该模型需在下游任务(如自动语音识别、翻译或分类)上进行微调。关于语音识别的微调细节,请查阅微调指南章节或技术博客。

目录

  • 如何微调
  • 模型详情
  • 附加链接

如何微调

即将上线...

模型详情

  • 开发团队: Vineel Pratap 等

  • 模型类型: 多语言自动语音识别模型

  • 支持语言: 1000+ 种语言

  • 许可协议: CC-BY-NC 4.0 许可证

  • 参数量: 10亿

  • 引用格式:

    @article{pratap2023mms,
      title={Scaling Speech Technology to 1,000+ Languages},
      author={Vineel Pratap and Andros Tjandra and Bowen Shi and Paden Tomasello and Arun Babu and Sayani Kundu and Ali Elkahky and Zhaoheng Ni and Apoorv Vyas and Maryam Fazel-Zarandi and Alexei Baevski and Yossi Adi and Xiaohui Zhang and Wei-Ning Hsu and Alexis Conneau and Michael Auli},
    journal={arXiv},
    year={2023}
    }

附加链接

  • 博客文章
  • Transformers文档
  • 学术论文
  • GitHub代码库
  • 其他MMS模型检查点
  • MMS语音识别微调检查点:
    • facebook/mms-1b-all
    • facebook/mms-1b-l1107
    • facebook/mms-1b-fl102
  • 官方演示空间