ilovebots/bert-sdg-french

该模型可根据联合国可持续发展目标（ODD）对文本进行分类。

来源：https://www.un.org/development/desa/disabilities/about-us/sustainable-development-goals-sdgs-and-disability.html

模型详情

模型描述

此文本分类模型是通过对预训练模型 dbmdz/bert-base-french-europeana-cased 进行微调开发而成。该微调模型的训练数据来源于公开的 OSDG 社区数据集（OSDG-CD），可通过以下地址获取：https://zenodo.org/record/5550238#.ZBulfcJByF4。该模型是在拉瓦尔大学的一项学术研究中开发的。
其目标是创建一个基于 transformers 的法语 SDG 文本分类模型。
模型的主要详情如下：

模型类型： 文本分类
语言（NLP）： 法语
许可证： mit
微调自模型： dbmdz/bert-base-french-europeana-cased

模型来源

如何开始使用模型

使用以下代码开始使用模型。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("ilovebots/bert-sdg-french")
model = AutoModelForSequenceClassification.from_pretrained("ilovebots/bert-sdg-french")

训练数据

https://zenodo.org/record/5550238#.ZBulfcJByF4 中的可用数据库已补充联合国可持续发展目标，并被翻译成法语。

训练超参数

Num_epoch = 4
Learning rate = 2e-5
Epsilon = 1e-8
Optimizer = AdamW
Batch size = 32
Seed random = 42

评估

指标

Accuracy = 0.84

引用

Martinez, D.F. (2023). SDG classification with BERT.