HuggingFace镜像/bert-punct-restoration-da
模型介绍文件和版本分析
下载使用量0

Bert Punctuation Restoration Danish

该模型用于执行丹麦语的标点恢复任务。所采用的方法是序列分类,与命名实体识别(NER)模型的训练方式类似。

模型描述

待办事项

使用方法

该模型需要一些额外的推理代码,因此我们创建了一个很棒的小型 pip 包用于推理。推理代码基于 Hugging Face 的 TokenClassificationPipeline 管道。

首先,通过运行以下命令安装这个小软件包:

pip install punctfix

那么恢复过程就像下面的代码片段一样简单:

>>> from punctfix import PunctFixer
>>> fixer = PunctFixer(language="da")

>>> example_text = "mit navn det er rasmus og jeg kommer fra firmaet alvenir det er mig som har trænet denne lækre model"
>>> print(fixer.punctuate(example_text))
'Mit navn det er Rasmus og jeg kommer fra firmaet Alvenir. Det er mig som har trænet denne lækre model.'

>>> example_text = "en dag bliver vi sku glade for at vi nu kan sætte punktummer og kommaer i en sætning det fungerer da meget godt ikke"
>>> print(fixer.punctuate(example_text)) 
'En dag bliver vi sku glade for, at vi nu kan sætte punktummer og kommaer i en sætning. Det fungerer da meget godt, ikke?'

训练数据

待办事项

训练流程

待办事项

预处理

待办事项

评估结果

待办事项