
Prompt Extend
根据提示的核心主旨生成合适风格提示词的文本生成模型。
该模型基于 GPT-2 架构,在 dataset 的 Stable Diffusion 提示词数据集上训练而成。
训练超参数
训练过程中使用了以下超参数:
- learning_rate: 0.0001
- train_batch_size: 128
- eval_batch_size: 256
- seed: 42
- optimizer: Adam,参数 betas=(0.9,0.999),epsilon=1e-08
- lr_scheduler_type: cosine
- lr_scheduler_warmup_ratio: 0.1
- num_epochs: 5
- mixed_precision_training: Native AMP
训练结果
| 训练损失 | 轮次 | 步数 | 验证损失 |
|---|
| 3.7436 | 1.0 | 12796 | 2.5429 |
| 2.3292 | 2.0 | 25592 | 2.0711 |
| 1.9439 | 3.0 | 38388 | 1.8447 |
| 1.7059 | 4.0 | 51184 | 1.7325 |
| 1.5775 | 5.0 | 63980 | 1.7110 |
框架版本
- Transformers 4.24.0
- Pytorch 1.13.0+cu117
- Datasets 2.7.1
- Tokenizers 0.13.2