HuggingFace镜像/gpt2
模型介绍文件和版本分析

西班牙语描述位于英语描述之后。

(英文)GPT2-small-spanish:适用于西班牙语文本生成的语言模型(以及更多自然语言处理任务……)

GPT2-small-spanish 是一款基于 GPT-2 small 模型的最先进西班牙语语言模型。

它使用迁移学习和微调技术在西班牙语维基百科上进行了训练。 该模型是从 English pre-trained GPT-2 small 微调而来,使用了封装在 fastai v2 深度学习框架中的 openmind 库,并应用了所有 fastai v2 微调技术。

局限性与偏见

(复制自原始 GPorTuguese-2 模型)本模型的训练数据来源于西班牙语维基百科。我们知道其中包含大量未经筛选的互联网内容,这些内容远非中立。正如 OpenAI 团队在其模型卡片中所指出的:

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构,因此我们不支持那些要求生成文本必须真实的使用场景。此外,像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见,因此除非部署者首先针对预期使用场景进行相关偏见研究,否则我们不建议将其部署到与人类交互的系统中。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异,这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时,都应保持类似程度的谨慎。

作者

该模型由 Josué Obregon 和 Berny Carrera (一个西班牙语机器学习学习空间)训练和评估。 此次训练得以进行,得益于 IAI Lab(庆熙大学)的多块 GPU(NVIDIA GTX1080-Ti GPU)提供的计算能力,Josué 作为工业人工智能领域的博士后研究员隶属于该实验室。

如前所述,这项工作主要基于 Pierre GUILLOU 的研究成果。

(西班牙语)GPT2-small-spanish:西班牙语文本生成语言模型(及其他部分自然语言处理任务……)

GPT2-small-spanish 是一款基于小型 GPT-2 模型开发的先进西班牙语语言模型。

它使用 迁移学习和模型微调技术 在西班牙语维基百科上进行了训练。

该模型基于英文模型 English pre-trained GPT-2 small 进行微调,采用了 openmind 库,并与深度学习框架 fastai v2 集成。微调过程中使用了 fastai v2 的精细微调技术。

局限性与偏见

(复制自原始模型 GPorTuguese-2 model)训练数据来源于西班牙语维基百科。众所周知,其中包含大量未经筛选的互联网内容,远非中立。OpenAI 开发团队在其模型说明中已指出这一点:

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构,我们不支持那些要求生成文本必须真实的使用场景。此外,像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见,因此我们不建议将它们部署到与人交互的系统中,除非部署者首先针对预期使用场景对相关偏见进行研究。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异,这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时,都应保持类似程度的谨慎。

作者

该模型由 Josué Obregon 和 Berny Carrera 进行训练和评估,他们致力于打造一个西班牙语机器学习学习空间。

此次训练得以实现,得益于工业人工智能实验室 IAI Lab(庆熙大学)的多块 GPU(NVIDIA GTX1080-Ti GPU)提供的计算能力。Josué 作为工业人工智能领域的博士后研究员隶属于该实验室。

如前所述,本工作基于 Pierre GUILLOU 的研究成果。

下载使用量0