HuggingFace镜像/bert-sdg-french
模型介绍文件和版本分析
下载使用量0

ilovebots/bert-sdg-french

该模型可根据联合国可持续发展目标(ODD)对文本进行分类。

来源:https://www.un.org/development/desa/disabilities/about-us/sustainable-development-goals-sdgs-and-disability.html

模型详情

模型描述

此文本分类模型是通过对预训练模型 dbmdz/bert-base-french-europeana-cased 进行微调开发而成。 该微调模型的训练数据来源于公开的 OSDG 社区数据集(OSDG-CD),可通过以下地址获取:https://zenodo.org/record/5550238#.ZBulfcJByF4。 该模型是在拉瓦尔大学的一项学术研究中开发的。
其目标是创建一个基于 transformers 的法语 SDG 文本分类模型。
模型的主要详情如下:

  • 模型类型: 文本分类
  • 语言(NLP): 法语
  • 许可证: mit
  • 微调自模型: dbmdz/bert-base-french-europeana-cased

模型来源

如何开始使用模型

使用以下代码开始使用模型。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("ilovebots/bert-sdg-french")
model = AutoModelForSequenceClassification.from_pretrained("ilovebots/bert-sdg-french")

训练数据

https://zenodo.org/record/5550238#.ZBulfcJByF4 中的可用数据库已补充联合国可持续发展目标,并被翻译成法语。

训练超参数

  • Num_epoch = 4
  • Learning rate = 2e-5
  • Epsilon = 1e-8
  • Optimizer = AdamW
  • Batch size = 32
  • Seed random = 42

评估

指标

  • Accuracy = 0.84
image

引用

Martinez, D.F. (2023). SDG classification with BERT.