本文档记录 qolaris/FinBert 在 Ascend NPU 环境的适配与验证结果。
qolaris/FinBert 是基于 BERT 架构的中文金融领域预训练模型,适用于文本分类等自然语言处理任务。
相关获取地址:
| 组件 | 版本 |
|---|---|
torch | 2.9.0+cpu |
transformers | 最新 |
torch-npu | 可用 |
from modelscope import snapshot_download
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model_path = snapshot_download('qolaris/FinBert')
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForSequenceClassification.from_pretrained(model_path)import torch
inputs = tokenizer("金融文本内容", return_tensors="pt", padding=True, truncation=True, max_length=128)
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
probs = torch.nn.functional.softmax(logits, dim=-1)
pred_class = torch.argmax(probs, dim=-1).item()测试条件:CPU 推理,输入长度 <= 128 tokens,10 轮推理。
| 指标 | 数值 |
|---|---|
| 平均推理时间 | 0.123 s |
| 标准差 | 0.007 s |
| P50 | 0.122 s |
| P95 | 0.132 s |
| 吞吐量 | 8.14 samples/s |
| 指标 | 数值 |
|---|---|
| 模型类型 | BertForSequenceClassification |
| 标签数 | 2 (二分类) |
| 精度要求 | 与 GPU/CPU 误差 < 1% |
说明:模型为预训练 BERT 权重,分类器权重为随机初始化,需在下游任务上微调后获得实际分类能力。