bert-base-multilingual-uncased-sentiment

这是一个基于bert-base-multilingual-uncased的模型，针对六种语言（英语、荷兰语、德语、法语、西班牙语和意大利语）的产品评论进行了情感分析微调。它能将评论的情感预测为星级数量（1到5星之间）。

该模型旨在直接用作上述六种语言中任何一种的产品评论情感分析模型，或用于在相关情感分析任务上进行进一步微调。

示例

使用openmind接口

>>> from openmind import pipeline
>>> pipe = pipeline('text-classification', model=model_path, device=device)
>>> print(pipe("I like you. I love you"))
{'label': '5 stars', 'score': 0.7865718007087708}

调用example下inference.py

cd examples
python inference.py

训练数据

以下是我们用于模型微调的产品评论数量：

语言	评论数量
English	150k
Dutch	80k
German	137k
French	140k
Italian	72k
Spanish	50k

准确率

微调后的模型在每种语言的5,000条预留产品评论上获得了以下准确率：

准确率（精确匹配）指的是星级数量的完全匹配。
准确率（误差±1）指的是模型预测的星级与人工评论者给出的星级最多相差1的评论所占百分比。

语言	准确率（精确匹配）	准确率（误差±1）
English	67%	95%
Dutch	57%	93%
German	61%	94%
French	59%	94%
Italian	59%	95%
Spanish	58%	95%