模型说明:deberta-v3-base-zeroshot-v1.1-all-33
该模型专为 Hugging Face 流水线的零样本分类任务设计。
该模型可执行一项通用分类任务:根据给定文本判断假设是“正确”还是“不正确”(即 entailment 与 not_entailment)。
此任务格式基于自然语言推理(NLI)任务。
该任务具有高度通用性,任何分类任务都可重新表述为此类任务。
有关模型训练方式和使用方法的详细说明,请参见此论文 。
训练数据
该模型在混合了33个数据集和387个类别 的数据上进行训练,这些数据均已重新格式化为上述通用格式。
五个 NLI 数据集,包含约885k文本:"mnli"、"anli"、"fever"、"wanli"、"ling"
28个分类任务,已重新格式化为通用 NLI 格式。为避免过拟合,使用了约51k条清洗后的文本:
'amazonpolarity'、'imdb'、'appreviews'、'yelpreviews'、'rottentomatoes'、
'emotiondair'、'emocontext'、'empathetic'、
'financialphrasebank'、'banking77'、'massive'、
'wikitoxic_toxicaggregated'、'wikitoxic_obscene'、'wikitoxic_threat'、'wikitoxic_insult'、'wikitoxic_identityhate'、
'hateoffensive'、'hatexplain'、'biasframes_offensive'、'biasframes_sex'、'biasframes_intent'、
'agnews'、'yahootopics'、
'trueteacher'、'spam'、'wellformedquery'、
'manifesto'、'capsotu'。
每个数据集的详细信息请参见:https://github.com/MoritzLaurer/zeroshot-classifier/blob/main/datasets_overview.csv
请注意,与其他 NLI 模型相比,本模型预测两个类别(entailment 与 not_entailment),而非三个类别(entailment/neutral/contradiction)。
该模型仅使用英文数据进行训练。对于多语言使用场景 ,
建议使用 EasyNMT 等库将文本机器翻译为英文。
仅英文模型通常比多语言模型表现更优,且如果您并非精通语料库中的所有语言,使用英文数据进行验证会更为简便。
如何使用模型
简单的零样本分类管道
import argparse
import torch
from openmind import pipeline, is_torch_npu_available
def parse_args():
parser = argparse.ArgumentParser()
parser.add_argument(
"--model_name_or_path",
default=None,
type=str,
help="Path to model",
required=False,
)
args = parser.parse_args()
return args
if __name__=="__main__":
args = parse_args()
if is_torch_npu_available():
device = "npu:0"
else:
device = "cpu"
#推理
text = "Angela Merkel is a politician in Germany and leader of the CDU"
hypothesis_template = "This example is about {}"
classes_verbalized = ["politics", "economy", "entertainment", "environment"]
zeroshot_classifier = pipeline('zero-shot-classification', model=args.model_name_or_path, device=device)
output = zeroshot_classifier(text, classes_verbalized, hypothesis_template=hypothesis_template, multi_label=False)
print(output)
数据与训练详情
数据准备以及模型训练和评估的代码已完全开源,具体可查看:https://github.com/MoritzLaurer/zeroshot-classifier/tree/main
超参数及其他详细信息可在以下 Weights & Biases 仓库中获取:https://wandb.ai/moritzlaurer/deberta-v3-base-zeroshot-v1-1-all-33/table?workspace=user-
指标
所有数据集均报告平衡准确率。
deberta-v3-base-zeroshot-v1.1-all-33 在所有数据集上进行训练,为避免过拟合,每个类别最多使用 500 条文本。因此,这些数据集上的指标并非严格意义上的零样本,因为模型在训练期间已接触过每个任务的部分数据。
deberta-v3-base-zeroshot-v1.1-heldout 表示在相应数据集上的零样本性能。为计算这些零样本指标,该流程运行了 28 次,每次训练时都会排除一个数据集,以模拟零样本设置。
deberta-v3-base-mnli-fever-anli-ling-wanli-binary deberta-v3-base-zeroshot-v1.1-heldout deberta-v3-base-zeroshot-v1.1-all-33 datasets mean (w/o nli) 62 70.7 84 amazonpolarity (2) 91.7 95.7 96 imdb (2) 87.3 93.6 94.5 appreviews (2) 91.3 92.2 94.4 yelpreviews (2) 95.1 97.4 98.3 rottentomatoes (2) 83 88.7 90.8 emotiondair (6) 46.5 42.6 74.5 emocontext (4) 58.5 57.4 81.2 empathetic (32) 31.3 37.3 52.7 financialphrasebank (3) 78.3 68.9 91.2 banking77 (72) 18.9 46 73.7 massive (59) 44 56.6 78.9 wikitoxic_toxicaggreg (2) 73.7 82.5 90.5 wikitoxic_obscene (2) 77.3 91.6 92.6 wikitoxic_threat (2) 83.5 95.2 96.7 wikitoxic_insult (2) 79.6 91 91.6 wikitoxic_identityhate (2) 83.9 88 94.4 hateoffensive (3) 55.2 66.1 86 hatexplain (3) 44.1 57.6 76.9 biasframes_offensive (2) 56.8 85.4 87 biasframes_sex (2) 85.4 87 91.8 biasframes_intent (2) 56.3 85.2 87.8 agnews (4) 77.3 80 90.5 yahootopics (10) 53.6 57.7 72.8 trueteacher (2) 51.4 49.5 82.4 spam (2) 51.8 50 97.2 wellformedquery (2) 49.9 52.5 77.2 manifesto (56) 5.8 18.9 39.1 capsotu (21) 25.2 64 72.5 mnli_m (2) 92.4 nan 92.7 mnli_mm (2) 92.4 nan 92.5 fevernli (2) 89 nan 89.1 anli_r1 (2) 79.4 nan 80 anli_r2 (2) 68.4 nan 68.4 anli_r3 (2) 66.2 nan 68 wanli (2) 81.6 nan 81.8 lingnli (2) 88.4 nan 88.4
局限性与偏差
该模型仅能执行文本分类任务。
有关潜在偏差,请参考原始的DeBERTa论文以及不同数据集的相关论文。
许可证
基础模型(DeBERTa-v3)依据MIT许可证发布。
用于模型微调的数据集依据多种不同的许可证发布。
下表提供了用于微调的非NLI数据集概述、许可证信息、相关论文等内容:https://github.com/MoritzLaurer/zeroshot-classifier/blob/main/datasets_overview.csv
引用
如果您在学术研究中使用此模型,请引用:
@misc{laurer_building_2023,
title = {Building {Efficient} {Universal} {Classifiers} with {Natural} {Language} {Inference}},
url = {http://arxiv.org/abs/2312.17543},
doi = {10.48550/arXiv.2312.17543},
abstract = {Generative Large Language Models (LLMs) have become the mainstream choice for fewshot and zeroshot learning thanks to the universality of text generation. Many users, however, do not need the broad capabilities of generative LLMs when they only want to automate a classification task. Smaller BERT-like models can also learn universal tasks, which allow them to do any text classification task without requiring fine-tuning (zeroshot classification) or to learn new tasks with only a few examples (fewshot), while being significantly more efficient than generative LLMs. This paper (1) explains how Natural Language Inference (NLI) can be used as a universal classification task that follows similar principles as instruction fine-tuning of generative LLMs, (2) provides a step-by-step guide with reusable Jupyter notebooks for building a universal classifier, and (3) shares the resulting universal classifier that is trained on 33 datasets with 389 diverse classes. Parts of the code we share has been used to train our older zeroshot classifiers that have been downloaded more than 55 million times via the Hugging Face Hub as of December 2023. Our new classifier improves zeroshot performance by 9.4\%.},
urldate = {2024-01-05},
publisher = {arXiv},
author = {Laurer, Moritz and van Atteveldt, Wouter and Casas, Andreu and Welbers, Kasper},
month = dec,
year = {2023},
note = {arXiv:2312.17543 [cs]},
keywords = {Computer Science - Artificial Intelligence, Computer Science - Computation and Language},
}
调试与问题解决
请注意,DeBERTa-v3 于 2021 年 12 月 6 日发布,较旧版本的 HF Transformers 可能在运行模型时出现问题(例如,导致分词器出现问题)。使用 Transformers>=4.13 版本可能会解决部分问题。
此外,请确保安装 sentencepiece 以避免分词器错误。运行以下命令:pip install transformers[sentencepiece] 或 pip install sentencepiece
用于分类的假设
下方表格中的假设用于对模型进行微调。
查看这些假设可以帮助用户了解模型是在何种类型的假设和任务上进行训练的。
您可以通过修改零样本管道的 hypothesis_template 来制定自己的假设。例如:
from transformers import pipeline
text = "Angela Merkel is a politician in Germany and leader of the CDU"
hypothesis_template = "Merkel is the leader of the party: {}"
classes_verbalized = ["CDU", "SPD", "Greens"]
zeroshot_classifier = pipeline("zero-shot-classification", model="MoritzLaurer/deberta-v3-base-zeroshot-v1.1-all-33")
output = zeroshot_classifier(text, classes_verbalised, hypothesis_template=hypothesis_template, multi_label=False)
print(output)
请注意,massive和banking77数据集中有几行包含nan,这是因为某些类别非常模糊或不明确,我已将它们从数据中排除。
label hypothesis not_well_formed 该示例不是格式良好的Google查询 well_formed 该示例是格式良好的Google查询。
biasframes_sex
label hypothesis not_sex 该示例不包含性内容的暗示。 sex 该示例包含性内容的暗示。
biasframes_intent
label hypothesis intent 该示例的意图是冒犯性的/不尊重的。 not_intent 该示例的意图不是冒犯性的/不尊重的。
biasframes_offensive
label hypothesis not_offensive 该示例不被视为冒犯性、不尊重或有毒性的内容。 offensive 该示例可被视为冒犯性、不尊重或有毒性的内容。
financialphrasebank
label hypothesis negative 从投资者角度看,该示例中的情绪为负面。 neutral 从投资者角度看,该示例中的情绪为中性。 positive 从投资者角度看,该示例中的情绪为正面。
rottentomatoes
label hypothesis negative 该示例烂番茄电影评论中的情绪为负面 positive 该示例烂番茄电影评论中的情绪为正面
amazonpolarity
label hypothesis negative 该示例亚马逊产品评论中的情绪为负面 positive 该示例亚马逊产品评论中的情绪为正面
imdb
label hypothesis negative 该示例imdb电影评论中的情绪为负面 positive 该示例imdb电影评论中的情绪为正面
appreviews
label hypothesis negative 该示例应用评论中的情绪为负面。 positive 该示例应用评论中的情绪为正面。
yelpreviews
label hypothesis negative 该示例Yelp评论中的情绪为负面。 positive 该示例Yelp评论中的情绪为正面。
wikitoxic_toxicaggregated
label hypothesis not_toxicaggregated 该示例维基百科评论不包含有毒语言。 toxicaggregated 该示例维基百科评论包含有毒语言。
wikitoxic_obscene
label hypothesis not_obscene 该示例维基百科评论不包含淫秽语言。 obscene 该示例维基百科评论包含淫秽语言。
wikitoxic_threat
label hypothesis not_threat 该示例维基百科评论不包含威胁内容。 threat 该示例维基百科评论包含威胁内容。
wikitoxic_insult
label hypothesis insult 该示例维基百科评论包含侮辱内容。 not_insult 该示例维基百科评论不包含侮辱内容。
wikitoxic_identityhate
label hypothesis identityhate 该示例维基百科评论包含身份仇恨内容。 not_identityhate 该示例维基百科评论不包含身份仇恨内容。
hateoffensive
label hypothesis hate_speech 该示例推文包含仇恨言论。 neither 该示例推文既不包含冒犯性语言也不包含仇恨言论。 offensive 该示例推文包含冒犯性语言但不包含仇恨言论。
hatexplain
label hypothesis hate_speech 该示例来自Twitter或Gab的文本包含仇恨言论。 neither 该示例来自Twitter或Gab的文本既不包含冒犯性语言也不包含仇恨言论。 offensive 该示例来自Twitter或Gab的文本包含冒犯性语言但不包含仇恨言论。
spam
label hypothesis not_spam 该示例短信不是垃圾信息。 spam 该示例短信是垃圾信息。
emotiondair
label hypothesis anger 该示例推文表达的情绪:愤怒 fear 该示例推文表达的情绪:恐惧 joy 该示例推文表达的情绪:喜悦 love 该示例推文表达的情绪:爱 sadness 该示例推文表达的情绪:悲伤 surprise 该示例推文表达的情绪:惊讶
emocontext
label hypothesis angry 该示例推文表达的情绪:愤怒 happy 该示例推文表达的情绪:快乐 others 该示例推文不表达以下任何情绪:愤怒、悲伤或快乐 sad 该示例推文表达的情绪:悲伤
empathetic
label hypothesis afraid 该示例对话的主要情绪是:害怕 angry 该示例对话的主要情绪是:愤怒 annoyed 该示例对话的主要情绪是:恼怒 anticipating 该示例对话的主要情绪是:期待 anxious 该示例对话的主要情绪是:焦虑 apprehensive 该示例对话的主要情绪是:担忧 ashamed 该示例对话的主要情绪是:羞愧 caring 该示例对话的主要情绪是:关怀 confident 该示例对话的主要情绪是:自信 content 该示例对话的主要情绪是:满足 devastated 该示例对话的主要情绪是:崩溃 disappointed 该示例对话的主要情绪是:失望 disgusted 该示例对话的主要情绪是:厌恶 embarrassed 该示例对话的主要情绪是:尴尬 excited 该示例对话的主要情绪是:兴奋 faithful 该示例对话的主要情绪是:忠诚 furious 该示例对话的主要情绪是:暴怒 grateful 该示例对话的主要情绪是:感激 guilty 该示例对话的主要情绪是:内疚 hopeful 该示例对话的主要情绪是:希望 impressed 该示例对话的主要情绪是:印象深刻 jealous 该示例对话的主要情绪是:嫉妒 joyful 该示例对话的主要情绪是:欢喜 lonely 该示例对话的主要情绪是:孤独 nostalgic 该示例对话的主要情绪是:怀旧 prepared 该示例对话的主要情绪是:准备就绪 proud 该示例对话的主要情绪是:自豪 sad 该示例对话的主要情绪是:悲伤 sentimental 该示例对话的主要情绪是:多愁善感 surprised 该示例对话的主要情绪是:惊讶 terrified 该示例对话的主要情绪是:恐惧 trusting 该示例对话的主要情绪是:信任
agnews
label hypothesis Business 该示例新闻文本是关于商业新闻的 Sci/Tech 该示例新闻文本是关于科学与技术的 Sports 该示例新闻文本是关于体育的 World 该示例新闻文本是关于世界新闻的
yahootopics
label hypothesis Business & Finance 该示例来自雅虎问答论坛的问题分类于主题:商业与金融 Computers & Internet 该示例来自雅虎问答论坛的问题分类于主题:计算机与互联网 Education & Reference 该示例来自雅虎问答论坛的问题分类于主题:教育与参考 Entertainment & Music 该示例来自雅虎问答论坛的问题分类于主题:娱乐与音乐 Family & Relationships 该示例来自雅虎问答论坛的问题分类于主题:家庭与关系 Health 该示例来自雅虎问答论坛的问题分类于主题:健康 Politics & Government 该示例来自雅虎问答论坛的问题分类于主题:政治与政府 Science & Mathematics 该示例来自雅虎问答论坛的问题分类于主题:科学与数学 Society & Culture 该示例来自雅虎问答论坛的问题分类于主题:社会与文化 Sports 该示例来自雅虎问答论坛的问题分类于主题:体育
massive
label hypothesis alarm_query 该示例 utterance 是关于闹钟的查询。 alarm_remove 该示例 utterance 的意图是移除闹钟。 alarm_set 该示例 utterance 的意图是设置闹钟。 audio_volume_down 该示例 utterance 的意图是降低音量。 audio_volume_mute 该示例 utterance 的意图是静音。 audio_volume_other 该示例 utterance 与音频音量相关。 audio_volume_up 该示例 utterance 的意图是调高音频音量。 calendar_query 该示例 utterance 是关于日历的查询。 calendar_remove 该示例 utterance 的意图是从日历中移除某些内容。 calendar_set 该示例 utterance 的意图是在日历中设置某些内容。 cooking_query 该示例 utterance 是关于烹饪的查询。 cooking_recipe 该示例 utterance 是关于烹饪食谱的。 datetime_convert 该示例 utterance 与日期时间变更或转换相关。 datetime_query 该示例 utterance 的意图是进行日期时间查询。 email_addcontact 该示例 utterance 的意图是将电子邮件地址添加到联系人。 email_query 该示例 utterance 是关于电子邮件的查询。 email_querycontact 该示例 utterance 的意图是查询联系人详细信息。 email_sendemail 该示例 utterance 的意图是发送电子邮件。 general_greet 该示例 utterance 是一般问候语。 general_joke 该示例 utterance 的意图是听笑话。 general_quirky nan iot_cleaning 该示例 utterance 的意图是让物联网设备开始清洁。 iot_coffee 该示例 utterance 的意图是让物联网设备煮咖啡。 iot_hue_lightchange 该示例 utterance 的意图是改变灯光。 iot_hue_lightdim 该示例 utterance 的意图是调暗灯光。 iot_hue_lightoff 该示例 utterance 与关灯相关。 iot_hue_lighton 该示例 utterance 与开灯相关。 iot_hue_lightup 该示例 utterance 的意图是调亮灯光。 iot_wemo_off 该示例 utterance 的意图是关闭物联网设备。 iot_wemo_on 该示例 utterance 的意图是打开物联网设备。 lists_createoradd 该示例 utterance 与创建列表或向列表添加内容相关。 lists_query 该示例 utterance 是关于列表的查询。 lists_remove 该示例 utterance 的意图是删除列表或从列表中删除某些内容。 music_dislikeness 该示例 utterance 的意图是表达对音乐的不喜欢。 music_likeness 该示例 utterance 与喜欢音乐相关。 music_query 该示例 utterance 是关于音乐的查询。 music_settings 该示例 utterance 的意图是更改音乐设置。 news_query 该示例 utterance 是关于新闻的查询。 play_audiobook 该示例 utterance 与播放有声书相关。 play_game 该示例 utterance 的意图是开始玩游戏。 play_music 该示例 utterance 的意图是让物联网设备播放音乐。 play_podcasts 该示例 utterance 与播放播客相关。 play_radio 该示例 utterance 的意图是在收音机上播放内容。 qa_currency 该示例 utterance 是关于货币的。 qa_definition 该示例 utterance 是关于定义的查询。 qa_factoid 该示例 utterance 是事实型问题。 qa_maths 该示例 utterance 是关于数学的问题。 qa_stock 该示例 utterance 是关于股票的。 recommendation_events 该示例 utterance 是关于活动推荐的。 recommendation_locations 该示例 utterance 的意图是获取地点推荐。 recommendation_movies 该示例 utterance 是关于电影推荐的。 social_post 该示例 utterance 是关于社交媒体帖子的。 social_query 该示例 utterance 是关于社交网络的查询。 takeaway_order 该示例 utterance 的意图是订购外卖食品。 takeaway_query 该示例 utterance 是关于外卖食品的。 transport_query 该示例 utterance 是关于交通或旅行的查询。 transport_taxi 该示例 utterance 的意图是叫出租车。 transport_ticket 该示例 utterance 是关于交通票务的。 transport_traffic 该示例 utterance 是关于交通或路况的。 weather_query 该示例 utterance 是关于天气的查询。
banking77
label hypothesis Refund_not_showing_up 此客户示例消息是关于退款未到账的问题。 activate_my_card 此银行客户示例消息是关于激活卡片的。 age_limit 此银行客户示例消息与年龄限制相关。 apple_pay_or_google_pay 此银行客户示例消息是关于Apple Pay或Google Pay的。 atm_support 此银行客户示例消息请求ATM支持。 automatic_top_up 此银行客户示例消息是关于自动充值的。 balance_not_updated_after_bank_transfer 此银行客户示例消息是关于银行转账后余额未更新的问题。 balance_not_updated_after_cheque_or_cash_deposit 此银行客户示例消息是关于支票或现金存款后余额未更新的问题。 beneficiary_not_allowed 此银行客户示例消息与受益人不被允许或转账失败相关。 cancel_transfer 此银行客户示例消息与转账取消相关。 card_about_to_expire 此银行客户示例消息与卡片即将过期相关。 card_acceptance 此银行客户示例消息与卡片的受理范围相关。 card_arrival 此银行客户示例消息是关于卡片送达的。 card_delivery_estimate 此银行客户示例消息是关于卡片送达预计时间的。 card_linking nan card_not_working 此银行客户示例消息是关于卡片无法使用的。 card_payment_fee_charged 此银行客户示例消息是关于卡片支付手续费的。 card_payment_not_recognised 此银行客户示例消息是关于客户未识别的一笔支付。 card_payment_wrong_exchange_rate 此银行客户示例消息是关于汇率错误的。 card_swallowed 此银行客户示例消息是关于卡片被机器吞卡的。 cash_withdrawal_charge 此银行客户示例消息是关于现金取款手续费的。 cash_withdrawal_not_recognised 此银行客户示例消息是关于未识别的现金取款。 change_pin 此银行客户示例消息是关于修改PIN码的。 compromised_card 此银行客户示例消息是关于卡片安全受到威胁的。 contactless_not_working 此银行客户示例消息是关于非接触式支付无法使用的。 country_support 此银行客户示例消息是关于特定国家/地区支持的。 declined_card_payment 此银行客户示例消息是关于卡片支付被拒绝的。 declined_cash_withdrawal 此银行客户示例消息是关于现金取款被拒绝的。 declined_transfer 此银行客户示例消息是关于转账被拒绝的。 direct_debit_payment_not_recognised 此银行客户示例消息是关于未识别的直接借记支付的。 disposable_card_limits 此银行客户示例消息是关于一次性卡片限额的。 edit_personal_details 此银行客户示例消息是关于编辑个人详细信息的。 exchange_charge 此银行客户示例消息是关于汇率手续费的。 exchange_rate 此银行客户示例消息是关于汇率的。 exchange_via_app nan extra_charge_on_statement 此银行客户示例消息是关于账单上的额外收费的。 failed_transfer 此银行客户示例消息是关于转账失败的。 fiat_currency_support 此银行客户示例消息是关于法定货币支持的。 get_disposable_virtual_card 此银行客户示例消息是关于获取一次性虚拟卡的。 get_physical_card nan getting_spare_card 此银行客户示例消息是关于获取备用卡的。 getting_virtual_card 此银行客户示例消息是关于获取虚拟卡的。 lost_or_stolen_card 此银行客户示例消息是关于卡片丢失或被盗的。 lost_or_stolen_phone 此银行客户示例消息是关于手机丢失或被盗的。 order_physical_card 此银行客户示例消息是关于订购实体卡的。 passcode_forgotten 此银行客户示例消息是关于忘记密码的。 pending_card_payment 此银行客户示例消息是关于待处理的卡片支付的。 pending_cash_withdrawal 此银行客户示例消息是关于待处理的现金取款的。 pending_top_up 此银行客户示例消息是关于待处理的充值的。 pending_transfer 此银行客户示例消息是关于待处理的转账的。 pin_blocked 此银行客户示例消息是关于PIN码被锁定的。 receiving_money 此银行客户示例消息是关于收款的。 request_refund 此银行客户示例消息是关于请求退款的。 reverted_card_payment? 此银行客户示例消息是关于撤销卡片支付的。 supported_cards_and_currencies nan terminate_account 此银行客户示例消息是关于终止账户的。 top_up_by_bank_transfer_charge nan top_up_by_card_charge 此银行客户示例消息是关于通过卡片充值的手续费的。 top_up_by_cash_or_cheque 此银行客户示例消息是关于通过现金或支票充值的。 top_up_failed 此银行客户示例消息是关于充值问题或失败的。 top_up_limits 此银行客户示例消息是关于充值限额的。 top_up_reverted 此银行客户示例消息是关于充值相关问题的。 topping_up_by_card 此银行客户示例消息是关于通过卡片充值的。 transaction_charged_twice 此银行客户示例消息是关于一笔交易被收取两次费用的。 transfer_fee_charged 此银行客户示例消息是关于转账手续费收取问题的。 transfer_into_account 此银行客户示例消息是关于转入客户本人账户的转账的。 transfer_not_received_by_recipient 此银行客户示例消息是关于收款人尚未收到转账的。 transfer_timing 此银行客户示例消息是关于转账到账时间的。 unable_to_verify_identity 此银行客户示例消息是关于身份验证问题的。 verify_my_identity 此银行客户示例消息是关于身份验证的。 verify_source_of_funds 此银行客户示例消息是关于资金来源的。 verify_top_up 此银行客户示例消息是关于充值验证的。 virtual_card_not_working 此银行客户示例消息是关于虚拟卡无法使用的。 visa_or_mastercard 此银行客户示例消息是关于银行卡类型的。 why_verify_identity 此银行客户示例消息询问为何需要进行身份验证。 wrong_amount_of_cash_received 此银行客户示例消息是关于收到的现金金额有误的。 wrong_exchange_rate_for_cash_withdrawal 此银行客户示例消息是关于现金取款汇率错误的。
trueteacher
label hypothesis factually_consistent 示例摘要与全文在事实层面是一致的。 factually_inconsistent 示例摘要与全文在事实层面是不一致的。
capsotu
label hypothesis Agriculture 这段美国总统一篇演讲中的示例文本是关于农业的。 Civil Rights 这段美国总统一篇演讲中的示例文本是关于民权、少数群体或公民自由的。 Culture 这段美国总统一篇演讲中的示例文本是关于文化政策的。 Defense 这段美国总统一篇演讲中的示例文本是关于国防或军事的。 Domestic Commerce 这段美国总统一篇演讲中的示例文本是关于银行业、金融业或商业的。 Education 这段美国总统一篇演讲中的示例文本是关于教育的。 Energy 这段美国总统一篇演讲中的示例文本是关于能源、电力或化石燃料的。 Environment 这段美国总统一篇演讲中的示例文本是关于环境、水、废弃物或污染的。 Foreign Trade 这段美国总统一篇演讲中的示例文本是关于对外贸易的。 Government Operations 这段美国总统一篇演讲中的示例文本是关于政府运作或行政管理的。 Health 这段美国总统一篇演讲中的示例文本是关于健康的。 Housing 这段美国总统一篇演讲中的示例文本是关于社区发展或住房问题的。 Immigration 这段美国总统一篇演讲中的示例文本是关于移民的。 International Affairs 这段美国总统一篇演讲中的示例文本是关于国际事务或对外援助的。 Labor 这段美国总统一篇演讲中的示例文本是关于就业或劳工的。 Law and Crime 这段美国总统一篇演讲中的示例文本是关于法律、犯罪或家庭问题的。 Macroeconomics 这段美国总统一篇演讲中的示例文本是关于宏观经济学的。 Public Lands 这段美国总统一篇演讲中的示例文本是关于公共土地或水资源管理的。 Social Welfare 这段美国总统一篇演讲中的示例文本是关于社会福利的。 Technology 这段美国总统一篇演讲中的示例文本是关于太空、科学、技术或通信的。 Transportation 这段美国总统一篇演讲中的示例文本是关于交通的。
manifesto
label hypothesis 农业与农民:积极 政党宣言中的这段示例文本对农业和农民相关政策持积极态度 反增长经济:积极 政党宣言中的这段示例文本支持反增长政治理念 反帝国主义 政党宣言中的这段示例文本具有反帝国主义色彩,例如反对控制其他国家,并主张殖民地拥有更大的自治权 中央集权 政党宣言中的这段示例文本支持政治中央集权 公民意识:积极 政党宣言中的这段示例文本对民族团结、公民社会或呼吁公共精神持积极态度,或反对反社会态度 宪政主义:消极 政党宣言中的这段示例文本对宪政主义持积极态度 宪政主义:积极 政党宣言中的这段示例文本对宪政主义及宪法现状持积极态度 计划经济 政党宣言中的这段示例文本支持政府对经济的直接控制,例如价格管制或最低工资 社团主义/混合经济 政党宣言中的这段示例文本支持政府、雇主和工会三方同时开展合作 文化:积极 政党宣言中的这段示例文本支持文化政策或休闲设施,例如博物馆、图书馆或公共体育俱乐部 去中心化 政党宣言中的这段示例文本支持权力下放或联邦制 民主 政党宣言中的这段示例文本对民主、民主程序或民主体制持肯定态度 经济目标 政党宣言中的这段示例文本是关于经济目标的宽泛/一般性陈述,未涉及具体内容 经济增长:积极 政党宣言中的这段示例文本支持经济增长,例如促进增加生产或政府为增长提供援助 经济正统主义 政党宣言中的这段示例文本支持经济正统主义,例如减少预算赤字、提倡节俭或维持强势货币 经济规划 政党宣言中的这段示例文本对政府经济规划持积极态度,例如政策计划或战略 教育扩张 政党宣言中的这段示例文本涉及扩大/改进教育政策的必要性 教育限制 政党宣言中的这段示例文本对国家教育支出持怀疑态度,例如支持学费制度或私立学校 环境保护 政党宣言中的这段示例文本支持环境保护,例如应对气候变化、“绿色”政策、保护自然资源或动物权利 平等:积极 政党宣言中的这段示例文本对平等或社会公正持积极态度,例如保护弱势群体或公平分配资源 欧洲共同体/联盟:消极 政党宣言中的这段示例文本对欧盟或欧洲共同体持负面看法 欧洲共同体/联盟:积极 政党宣言中的这段示例文本对欧盟或欧洲共同体持积极态度,例如支持欧盟扩张和一体化 对外特殊关系:消极 政党宣言中的这段示例文本对特定国家持负面态度 对外特殊关系:积极 政党宣言中的这段示例文本对特定国家持积极态度 自由市场经济 政党宣言中的这段示例文本支持自由市场经济和资本主义 自由与人权 政党宣言中的这段示例文本支持自由和人权,例如言论自由、集会自由,反对国家强制,或支持个人主义 政府与行政效率 政党宣言中的这段示例文本支持政府/行政部门提高效率,例如通过重组公务员体系或改进官僚机构 激励措施:积极 政党宣言中的这段示例文本支持供给侧经济政策对企业的扶持,例如提供补贴或税收减免等激励措施 国际主义:消极 政党宣言中的这段示例文本对国际主义持怀疑态度,例如反对国际合作,支持国家主权和单边主义 国际主义:积极 政党宣言中的这段示例文本支持与其他国家开展国际合作,例如提及需要向发展中国家提供援助或支持全球治理 凯恩斯需求管理 政党宣言中的这段示例文本支持凯恩斯需求管理和需求侧经济政策 劳工团体:消极 政党宣言中的这段示例文本对劳工团体和工会持负面态度 劳工团体:积极 政党宣言中的这段示例文本对劳工团体持积极态度,例如支持良好的工作条件、公平工资或工会 法律与秩序:积极 政党宣言中的这段示例文本对法律与秩序以及严格执法持积极态度 市场监管 政党宣言中的这段示例文本支持市场监管以维护公平开放的市场,例如保护消费者、促进竞争或支持社会市场经济 马克思主义分析 政党宣言中的这段示例文本对马克思列宁主义思想持积极态度或使用特定的马克思主义术语 中产阶级与专业群体 政党宣言中的这段示例文本对中产阶级持肯定态度,例如白领群体或服务行业 军事:消极 政党宣言中的这段示例文本对军队持负面态度,例如主张减少军费开支或裁军 军事:积极 政党宣言中的这段示例文本对军队持积极态度,例如支持军费开支、重整军备或履行军事条约义务 多元文化主义:消极 政党宣言中的这段示例文本对多元文化主义持怀疑态度,或支持文化融合,或呼吁社会文化同质化 多元文化主义:积极 政党宣言中的这段示例文本对文化多样性持肯定态度,例如支持宗教自由或语言遗产保护 民族生活方式:消极 政党宣言中的这段示例文本对国家的民族和历史持否定态度,例如对爱国主义或民族自豪感持怀疑态度 民族生活方式:积极 政党宣言中的这段示例文本对民族生活方式和历史持积极态度,例如公民自豪感或呼吁爱国主义 国有化 政党宣言中的这段示例文本支持政府对工业或土地的所有权,或支持经济国有化 非经济人口群体 政党宣言中的这段示例文本对非经济人口群体持肯定态度,如妇女、学生或特定年龄群体 和平 政党宣言中的这段示例文本对和平及和平解决危机的方式持积极态度,例如支持谈判和结束战争 政治权威 政党宣言中的这段示例文本提及发言者的执政能力或其他政党缺乏这种能力,或对强大/稳定的政府持肯定态度 政治腐败 政党宣言中的这段示例文本对政治腐败或滥用政治/官僚权力持负面态度 保护主义:消极 政党宣言中的这段示例文本对保护主义持负面态度,支持自由贸易 保护主义:积极 政党宣言中的这段示例文本支持保护主义,例如关税、出口补贴 技术与基础设施:积极 政党宣言中的这段示例文本涉及技术和基础设施,例如强调工业现代化的重要性,或支持对基础设施/技术的公共支出 传统道德:消极 政党宣言中的这段示例文本对传统道德持负面态度,例如反对宗教道德价值观,支持离婚或堕胎,支持现代家庭模式或政教分离 传统道德:积极 政党宣言中的这段示例文本对传统或宗教价值观持肯定态度,例如支持对不道德行为进行审查,支持传统家庭价值观或宗教机构 弱势少数群体 政党宣言中的这段示例文本对弱势少数群体持肯定态度,例如残疾人、同性恋者或移民 福利国家扩张 政党宣言中的这段示例文本对福利国家持积极态度,例如医疗保健、养老金或社会住房 福利国家限制 政党宣言中的这段示例文本主张限制福利国家,例如公共资金用于社会服务或社会保障方面,支持先由私人提供照料,再由国家提供