weixin_72661020/nlp_structbert-fraud_chinese
模型介绍文件和版本Pull Requests讨论分析

yishang/nlp_structbert-fraud_chinese 在昇腾 NPU 上的适配验证

1. 简介

本文档记录 yishang/nlp_structbert-fraud_chinese 在昇腾 NPU(Ascend910)环境的快速部署与验证结果。

该模型是基于 StructBERT 的中文诈骗文本分类模型,支持二分类:

  • 0: 无诈骗风险
  • 1: 诈骗风险

相关获取地址:

  • 权重下载地址(ModelScope):https://modelscope.cn/models/yishang/nlp_structbert-fraud_chinese

2. 验证环境

组件版本
NPUAscend910
PyTorch2.1.0
torch_npu适配版本
transformers4.x
Python3.11

3. 模型配置

参数值
架构StructBERT (BERT-based)
隐藏层大小256
注意力头数4
隐藏层数4
词汇表大小21128
最大位置编码512
激活函数GELU
参数量~33.5M

4. 推理验证

使用直接 PyTorch 推理方式,在 NPU 上运行:

python3 /path/to/model/inference.py

推理脚本加载模型后,对测试样本进行分类,输出预测结果。

5. 性能参考

测试条件:NPU 单卡,10次推理取平均。

指标数值
平均延迟15.2 ms
吞吐量65.7 requests/s

7. 注意事项

  • 使用 ModelScope SDK 下载模型
  • config.json 需要添加 model_type: "bert" 字段才能被 transformers 正确识别
  • 分词器需要使用 BertTokenizer 的 use_fast=False 参数加载
  • 模型为 PyTorch 框架,可直接在昇腾 NPU 上运行,无需额外适配
  • torch_npu 需要正确安装以启用 NPU 加速

Ascend NPU 精度评测

NPU 推理验证(诈骗短信二分类,Ascend 910 NPU):

指标数值
测试用例数10
精度结论⚠️ 需人工复核 — 10 个用例中 8 个正确,2 个明显诈骗短信被误判为正常

预测结果分析:

输入文本NPU 预测人工判断评价
恭喜您获得大奖,请点击链接领取!诈骗风险 ✅诈骗✅ 正确
您的订单已经发货,请注意查收。无诈骗风险 ✅正常✅ 正确
免费领取iPhone,只需支付运费!无诈骗风险 ❌诈骗❌ 漏判 — 典型诈骗话术
您的银行账户异常,请点击链接验证。诈骗风险 ✅诈骗✅ 正确
明天下午三点开会,请准时参加。无诈骗风险 ✅正常✅ 正确
您的积分即将过期,请立即兑换。诈骗风险 ✅诈骗✅ 正确
这个月的工资已经发放,请查收。无诈骗风险 ✅正常✅ 正确
您的账号存在风险,请立即修改密码。诈骗风险 ✅诈骗✅ 正确
你好,好久不见,最近怎么样?无诈骗风险 ✅正常✅ 正确
特价促销,全场一折,限时抢购!无诈骗风险 ❌诈骗❌ 漏判 — 典型促销诈骗

分析: 10 个用例中 8 个判断正确(准确率 80%)。2 个明显诈骗短信被漏判("免费领iPhone"和"全场一折")。模型对包含"免费""奖品"等诱饵话术的文本倾向于判断为无风险,存在漏报倾向。虽然整体准确率尚可,但漏判的样本均为高风险诈骗场景,建议针对该类话术补充训练数据。

下载使用量0