所有功劳归于 Certainly(前身为 BotXO),是他们开发了丹麦语 BERT。有关数据和训练详情,请参阅他们的 GitHub 仓库 或 本文。你也可以访问他们在 Hugging Face 上的 组织页面。
它同时提供 TensorFlow 和 PyTorch 格式。
原始 TensorFlow 版本可通过 此链接 下载。
以下是使用 🤗Transformers 库在 PyTorch 中加载丹麦语 BERT 的示例:
from transformers import AutoTokenizer, AutoModelForPreTraining
tokenizer = AutoTokenizer.from_pretrained("Maltehb/danish-bert-botxo")
model = AutoModelForPreTraining.from_pretrained("Maltehb/danish-bert-botxo")