HuggingFace镜像/distilroberta-finetuned-financial-news-sentiment_analysis
模型介绍文件和版本分析

DistilRoberta-financial-sentiment

该模型是 [distilroberta-base] 在 financial_phrasebank 数据集上的微调版本。 其在评估集上取得了以下结果:

  • 损失值:0.1116
  • 准确率:0.9823

基础模型描述

本模型是 [RoBERTa-base model] 的蒸馏版本。它遵循与 [DistilBERT] 相同的训练流程。 蒸馏过程的代码可在以下位置找到: 该模型区分大小写:例如,“English”和“english”会被视为不同。

该模型具有 6 层、768 维隐藏状态和 12 个注意力头,总参数为 8200 万(相比之下,RoBERTa-base 为 1.25 亿参数)。 平均而言,DistilRoBERTa 的速度是 Roberta-base 的两倍。

训练数据

来自财经新闻句子的极性情感数据集。该数据集包含 4840 个来自英语财经新闻的句子,并按情感进行分类。数据集按 5-8 名注释者的一致率进行划分。

训练过程

训练超参数

训练过程中使用了以下超参数:

  • learning_rate: 2e-05
  • train_batch_size: 8
  • eval_batch_size: 8
  • seed: 42
  • optimizer: Adam,betas=(0.9,0.999),epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 5

训练结果

训练损失轮次步数验证损失准确率
无记录1.02550.16700.9646
0.2092.05100.22900.9558
0.2093.07650.20440.9558
0.03264.010200.11160.9823
0.03265.012750.11270.9779

框架版本

  • Transformers 4.10.2
  • Pytorch 1.9.0+cu102
  • Datasets 1.12.1
  • Tokenizers 0.10.3
下载使用量0