西班牙语描述位于英语描述之后。

（英文）GPT2-small-spanish：适用于西班牙语文本生成的语言模型（以及更多自然语言处理任务……）

GPT2-small-spanish 是一款基于 GPT-2 small 模型的最先进西班牙语语言模型。

它使用迁移学习和微调技术在西班牙语维基百科上进行了训练。该模型是从 English pre-trained GPT-2 small 微调而来，使用了封装在 fastai v2 深度学习框架中的 openmind 库，并应用了所有 fastai v2 微调技术。

局限性与偏见

（复制自原始 GPorTuguese-2 模型）本模型的训练数据来源于西班牙语维基百科。我们知道其中包含大量未经筛选的互联网内容，这些内容远非中立。正如 OpenAI 团队在其模型卡片中所指出的：

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构，因此我们不支持那些要求生成文本必须真实的使用场景。此外，像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见，因此除非部署者首先针对预期使用场景进行相关偏见研究，否则我们不建议将其部署到与人类交互的系统中。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异，这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时，都应保持类似程度的谨慎。

作者

该模型由 Josué Obregon 和 Berny Carrera （一个西班牙语机器学习学习空间）训练和评估。此次训练得以进行，得益于 IAI Lab（庆熙大学）的多块 GPU（NVIDIA GTX1080-Ti GPU）提供的计算能力，Josué 作为工业人工智能领域的博士后研究员隶属于该实验室。

如前所述，这项工作主要基于 Pierre GUILLOU 的研究成果。

（西班牙语）GPT2-small-spanish：西班牙语文本生成语言模型（及其他部分自然语言处理任务……）

GPT2-small-spanish 是一款基于小型 GPT-2 模型开发的先进西班牙语语言模型。

它使用 迁移学习和模型微调技术 在西班牙语维基百科上进行了训练。

该模型基于英文模型 English pre-trained GPT-2 small 进行微调，采用了 openmind 库，并与深度学习框架 fastai v2 集成。微调过程中使用了 fastai v2 的精细微调技术。

局限性与偏见

（复制自原始模型 GPorTuguese-2 model）训练数据来源于西班牙语维基百科。众所周知，其中包含大量未经筛选的互联网内容，远非中立。OpenAI 开发团队在其模型说明中已指出这一点：

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构，我们不支持那些要求生成文本必须真实的使用场景。此外，像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见，因此我们不建议将它们部署到与人交互的系统中，除非部署者首先针对预期使用场景对相关偏见进行研究。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异，这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时，都应保持类似程度的谨慎。

作者

该模型由 Josué Obregon 和 Berny Carrera 进行训练和评估，他们致力于打造一个西班牙语机器学习学习空间。

此次训练得以实现，得益于工业人工智能实验室 IAI Lab（庆熙大学）的多块 GPU（NVIDIA GTX1080-Ti GPU）提供的计算能力。Josué 作为工业人工智能领域的博士后研究员隶属于该实验室。

如前所述，本工作基于 Pierre GUILLOU 的研究成果。

西班牙语描述位于英语描述之后。

（英文）GPT2-small-spanish：适用于西班牙语文本生成的语言模型（以及更多自然语言处理任务……）

GPT2-small-spanish 是一款基于 GPT-2 small 模型的最先进西班牙语语言模型。

局限性与偏见

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构，因此我们不支持那些要求生成文本必须真实的使用场景。此外，像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见，因此除非部署者首先针对预期使用场景进行相关偏见研究，否则我们不建议将其部署到与人类交互的系统中。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异，这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时，都应保持类似程度的谨慎。

作者

如前所述，这项工作主要基于 Pierre GUILLOU 的研究成果。

（西班牙语）GPT2-small-spanish：西班牙语文本生成语言模型（及其他部分自然语言处理任务……）

GPT2-small-spanish 是一款基于小型 GPT-2 模型开发的先进西班牙语语言模型。

它使用 迁移学习和模型微调技术 在西班牙语维基百科上进行了训练。

局限性与偏见

由于像 GPT-2 这样的大规模语言模型无法区分事实与虚构，我们不支持那些要求生成文本必须真实的使用场景。此外，像 GPT-2 这样的语言模型会反映其训练数据中固有的偏见，因此我们不建议将它们部署到与人交互的系统中，除非部署者首先针对预期使用场景对相关偏见进行研究。我们发现 774M 和 1.5B 版本在性别、种族和宗教偏见探测方面没有统计学上的显著差异，这意味着所有版本的 GPT-2 在涉及对人类属性敏感的偏见使用场景时，都应保持类似程度的谨慎。

作者

该模型由 Josué Obregon 和 Berny Carrera 进行训练和评估，他们致力于打造一个西班牙语机器学习学习空间。

如前所述，本工作基于 Pierre GUILLOU 的研究成果。