这是一个基于bert-base-multilingual-uncased的模型,针对六种语言(英语、荷兰语、德语、法语、西班牙语和意大利语)的产品评论进行了情感分析微调。它能将评论的情感预测为星级数量(1到5星之间)。
该模型旨在直接用作上述六种语言中任何一种的产品评论情感分析模型,或用于在相关情感分析任务上进行进一步微调。
使用openmind接口
>>> from openmind import pipeline
>>> pipe = pipeline('text-classification', model=model_path, device=device)
>>> print(pipe("I like you. I love you"))
{'label': '5 stars', 'score': 0.7865718007087708}调用example下inference.py
cd examples
python inference.py以下是我们用于模型微调的产品评论数量:
| 语言 | 评论数量 |
|---|---|
| English | 150k |
| Dutch | 80k |
| German | 137k |
| French | 140k |
| Italian | 72k |
| Spanish | 50k |
微调后的模型在每种语言的5,000条预留产品评论上获得了以下准确率:
| 语言 | 准确率(精确匹配) | 准确率(误差±1) |
|---|---|---|
| English | 67% | 95% |
| Dutch | 57% | 93% |
| German | 61% | 94% |
| French | 59% | 94% |
| Italian | 59% | 95% |
| Spanish | 58% | 95% |