HuggingFace镜像/prompt-extend
模型介绍文件和版本分析
下载使用量0

Generic badge

Prompt Extend

根据提示的核心主旨生成合适风格提示词的文本生成模型。

该模型基于 GPT-2 架构,在 dataset 的 Stable Diffusion 提示词数据集上训练而成。

训练超参数

训练过程中使用了以下超参数:

  • learning_rate: 0.0001
  • train_batch_size: 128
  • eval_batch_size: 256
  • seed: 42
  • optimizer: Adam,参数 betas=(0.9,0.999),epsilon=1e-08
  • lr_scheduler_type: cosine
  • lr_scheduler_warmup_ratio: 0.1
  • num_epochs: 5
  • mixed_precision_training: Native AMP

训练结果

训练损失轮次步数验证损失
3.74361.0127962.5429
2.32922.0255922.0711
1.94393.0383881.8447
1.70594.0511841.7325
1.57755.0639801.7110

框架版本

  • Transformers 4.24.0
  • Pytorch 1.13.0+cu117
  • Datasets 2.7.1
  • Tokenizers 0.13.2