HuggingFace镜像/PhoWhisper-large
模型介绍文件和版本分析
下载使用量0

PhoWhisper:越南语自动语音识别

我们推出了五个版本的PhoWhisper,用于越南语自动语音识别。PhoWhisper 的稳健性是通过在包含多种越南语口音的 844 小时数据集上对多语言 Whisper 进行微调实现的。我们的实验研究表明,PhoWhisper 在越南语 ASR 基准数据集上实现了最先进的性能。当 PhoWhisper 用于帮助生成已发表的成果或被整合到其他软件中时,请引用我们关于 PhoWhisper 的论文:

@inproceedings{PhoWhisper,
  title     = {{PhoWhisper: Automatic Speech Recognition for Vietnamese}},
  author    = {Thanh-Thien Le and Linh The Nguyen and Dat Quoc Nguyen},
  booktitle = {Proceedings of the ICLR 2024 Tiny Papers track},
  year      = {2024}
}

如需进一步信息或有相关需求,请访问 PhoWhisper's homepage!