这是我们在modelers上发布的人工智能模型的初始版本。需要注意的是,此版本仅仅是一个开始;该模型将随着时间的推移不断改进。目前,该模型的准确率为79%,但我们计划通过每月更新定期提高这一数值。
我们自豪地宣布,我们的模型是目前意大利唯一能够识别多达52种不同类别的模型。这一能力使其在意大利现有的其他模型中脱颖而出,在实体识别方面提供了前所未有的多功能性和广度。
该模型基于BERT架构,这是自然语言处理(NLP)领域最先进的技术之一。其训练采用了最先进的技术,确保了高水平的准确性和效率。这一技术选择确保了对自然语言的深入且复杂的理解。
该模型能够识别以下类别:
要使用此模型:
from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline
from openmind import is_torch_npu_available
from openmind_hub import snapshot_download
import argparse
import torch
import torch_npu
def parse_args():
parser = argparse.ArgumentParser()
parser.add_argument( "--model_name_or_path", type=str, help="Path to model", default=None)
args = parser.parse_args()
return args
args = parse_args()
if args.model_name_or_path:
model_path = args.model_name_or_path
else:
model_path = snapshot_download(
"CICC/Italian_NER_XXL",
revision="main",
resume_download=True,
ignore_patterns=["*.h5", "*.ot", " *.msgpack"]
)
#model_path = args.model_name_or_path
device = torch.device('npu:0') if is_torch_npu_available() else torch.device('cpu')
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForTokenClassification.from_pretrained(model_path, ignore_mismatched_sizes=True).to(device)
nlp = pipeline("ner", model=model, tokenizer=tokenizer)
example = """Il commendatore Gianluigi Alberico De Laurentis-Ponti, con residenza legale in Corso Imperatrice 67, Torino, avente codice fiscale DLNGGL60B01L219P, è amministratore delegato della "De Laurentis Advanced Engineering Group S.p.A.", che si trova in Piazza Affari 32, Milano (MI); con una partita IVA di 09876543210, la società è stata recentemente incaricata di sviluppare una nuova linea di componenti aerospaziali per il progetto internazionale di esplorazione di Marte."""
ner_results = nlp(example)
print(ner_results)
本模型的主要目标是对各类实体进行高效且精准的识别,突破传统模型的局限。作为意大利境内唯一能够识别如此多实体的模型,我们相信它将成为众多应用领域的宝贵工具。对模型进行持续优化和改进是我们的首要任务,以确保其始终保持卓越性能。
如果您有兴趣为本项目贡献力量、提出改进建议,或需要针对特定场景的命名实体识别器,欢迎随时与我们联系。您的意见和合作将显著提升模型的性能和应用范围。如需咨询或讨论潜在贡献,请联系Michele Montebovi,邮箱地址:montebovi.michele@gmail.com。我们致力于不断改进和扩展Italian_NER_XXL模型的功能,非常感谢您的支持与参与。