本文档记录 Fengshenbang/Erlangshen-RoBERTa-110M-Sentiment 在华为昇腾 Ascend NPU 环境的快速部署与验证结果。
Erlangshen-RoBERTa-110M-Sentiment 是 Fengshenbang 系列的中文情感分析模型,基于 RoBERTa 架构(BertForSequenceClassification),参数量 110M,支持中文文本的正负向情感分类。
相关获取地址:
| 组件 | 版本 |
|---|---|
| NPU | Ascend910 |
| PyTorch | 2.9.0 |
| torch_npu | 2.9.0 |
| transformers | 4.20.0 |
/opt/atomgit/Fengshenbang/Erlangshen-RoBERTa-110M-Sentiment/model/Fengshenbang/Erlangshen-RoBERTa-110M-Sentiment由于模型为 BertForSequenceClassification 情感分析模型,不支持 vLLM 推理,直接使用 PyTorch + torch_npu 进行推理。
export ASCEND_RT_VISIBLE_DEVICES=0
python3 inference.py执行推理脚本验证:
python3 inference.py预期输出示例:
=== Sentiment Analysis Results ===
Text: 今天天气真好,心情非常愉快!
Sentiment: Positive (confidence: 0.9923)
Text: 这个产品质量太差了,非常失望。
Sentiment: Negative (confidence: 0.9954)测试条件:20 轮推理,max_length=128。
| 指标 | 数值 |
|---|---|
| 总时间 | 0.325 s |
| 平均推理时间 | 0.0162 s |
| 吞吐量 | 61.55 req/s |
使用 5 个中文情感分类测试样本进行验证。
| 指标 | 数值 |
|---|---|
| 总用例数 | 5 |
| 正确数 | 5 |
| 准确率 | 100.0% |
| 精度要求 | 与 GPU/CPU 误差 < 1% |