Prompt Extend

根据提示的核心主旨生成合适风格提示词的文本生成模型。

该模型基于 GPT-2 架构，在 dataset 的 Stable Diffusion 提示词数据集上训练而成。

训练超参数

训练过程中使用了以下超参数：

learning_rate: 0.0001
train_batch_size: 128
eval_batch_size: 256
seed: 42
optimizer: Adam，参数 betas=(0.9,0.999)，epsilon=1e-08
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.1
num_epochs: 5
mixed_precision_training: Native AMP

训练结果

训练损失	轮次	步数	验证损失
3.7436	1.0	12796	2.5429
2.3292	2.0	25592	2.0711
1.9439	3.0	38388	1.8447
1.7059	4.0	51184	1.7325
1.5775	5.0	63980	1.7110

框架版本

Transformers 4.24.0
Pytorch 1.13.0+cu117
Datasets 2.7.1
Tokenizers 0.13.2