HuggingFace镜像/gpt2-base-thai
模型介绍文件和版本分析

GPT-2 Base Thai

GPT-2 Base Thai 是一个基于 OpenAI GPT-2 模型的因果语言模型。它在 OSCAR 数据集,特别是 unshuffled_deduplicated_th 子集上进行了训练。该模型从零开始训练,最终达到了 1.708 的评估损失和 5.516 的评估困惑度。

此模型使用 HuggingFace 的 Flax 框架进行训练,并且是 JAX/Flax 社区周活动的一部分。所有训练均在由 Google Cloud 团队赞助的 TPUv3-8 虚拟机上完成。

模型

模型参数数量架构训练/验证数据(文本)
gpt2-base-thai124MGPT-2unshuffled_deduplicated_th 数据集

评估结果

该模型训练了 3 个 epoch,以下是训练结束时的最终结果。

训练损失验证损失验证 PPL总时间
1.6381.7085.5166:12:34

使用方法

作为因果语言模型

from openmind import pipeline
pretrained_name = "SY_AICC/gpt2-base-thai"
nlp = pipeline(
    "text-generation",
    model=pretrained_name,
    tokenizer=pretrained_name
)
nlp("สวัสดีตอนเช้า")

PyTorch 中的特征提取

from openmind import AutoTokenizer, AutoModel
pretrained_name = "SY_AICC/gpt2-base-thai"
model = AutoModel.from_pretrained(pretrained_name)
tokenizer = AutoTokenizer.from_pretrained(pretrained_name)
prompt = "สวัสดีตอนเช้า"
encoded_input = tokenizer(prompt, return_tensors='pt')
output = model(**encoded_input)

团队成员

  • Sakares Saengkaew
  • Wilson Wongso
下载使用量0