DistilRoBERTa-base 是一个用于情感分析的 transformer 模型。我使用《老友记》的剧本对白对该模型进行了微调,目的是从文本数据(特别是网飞剧集或电影的对话)中进行情感分类。该模型可预测 6 种埃克曼情感以及一个中性类别,包括愤怒、厌恶、恐惧、喜悦、中性、悲伤和惊讶。
本模型是 Emotion English DistilRoBERTa-base 和 DistilRoBERTa-base 的微调版本。该模型最初基于 Emotion English DistilRoBERTa-base 的以下数据集进行训练:
| 名称 | anger | disgust | fear | joy | neutral | sadness | surprise |
|---|---|---|---|---|---|---|---|
| Crowdflower (2016) | Yes | - | - | Yes | Yes | Yes | Yes |
| Emotion Dataset, Elvis et al. (2018) | Yes | - | Yes | Yes | - | Yes | Yes |
| GoEmotions, Demszky et al. (2020) | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| ISEAR, Vikash (2018) | Yes | Yes | Yes | Yes | - | Yes | - |
| MELD, Poria et al. (2019) | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
| SemEval-2018, EI-reg, Mohammad et al. (2018) | Yes | - | Yes | Yes | - | Yes | - |
随后使用以下数据集进行了微调:
| 名称 | anger | disgust | fear | joy | neutral | sadness | surprise |
|---|---|---|---|---|---|---|---|
| Emotion Lines (Friends) | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
from transformers import pipeline
classifier = pipeline("sentiment-analysis", model="michellejieli/emotion_text_classifier")
classifier("I love this!")输出: [{'label': 'joy', 'score': 0.9887555241584778}]