由于部分数据集的许可问题,该模型已被迫下架。
本仓库包含 OpenAI 的 Whisper Large V3 Turbo 模型的微调版本,该版本通过 QLoRa 优化专门针对瑞士德语方言进行了适配。该模型在瑞士德语自动语音识别(ASR)方面达到了最先进的性能。
该模型的性能已在多个代表瑞士德语不同方言和人口分布的数据集上进行了评估。
该模型的训练和评估基于一套全面的瑞士德语数据集:
SDS-200 语料库
STT4SG-350
SwissDial-Zh v1.1
瑞士议会语料库 V2(SPC)
ASGDTS(全瑞士德语方言测试集)
| 模型 | WER (全部) | WER SD (全部) |
|---|---|---|
| Turbo V3 Swiss German | 0.1672 | 0.1754 |
| Large V3 | 0.2884 | 0.2829 |
| Turbo V3 | 0.4392 | 0.2777 |
| 模型 | BLEU (全部) | BLEU SD (全部) |
|---|---|---|
| Turbo V3 Swiss German | 0.65 | 0.3149 |
| Large V3 | 0.5345 | 0.3453 |
| Turbo V3 | 0.3367 | 0.2975 |



该模型可直接与 Hugging Face Transformers 库配合使用,适用于需要瑞士德语语音识别(ASR)的任务。
特别感谢本研究中使用的数据集的创建者和维护者:
同时感谢日内瓦大学为我们提供其高性能计算集群的访问权限,本模型的训练工作在此集群上完成。
如果您在研究工作中使用了本模型,请按以下方式引用本仓库:
@misc{whisper-large-v3-turbo-swissgerman,
author = {Nizar Michaud},
title = {Whisper Large V3 Turbo Fine-Tuned for Swiss German},
year = {2024},
publisher = {Hugging Face},
url = {https://huggingface.co/nizarmichaud/whisper-large-v3-turbo-swissgerman},
doi = 10.57967/hf/3858,
}