weixin_72661020/uer_windows
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

tiansz/uer_windows on Ascend NPU

1. 简介

tiansz/uer_windows 是基于 UER-py 框架的文本分类模型,主干模型为 RoBERTa-wwm-base(12层Transformer、768隐藏维度、12注意力头)。该模型在昇腾 Ascend910 NPU 上完成了适配和验证。

  • 模型下载地址(ModelScope):https://modelscope.cn/models/tiansz/uer_windows
  • 框架:UER-py (PyTorch)
  • 任务:文本分类

2. 验证环境

组件版本
NPUAscend910
PyTorch2.9.0+cpu
torch_npu2.9.0.post1+gitee7ba04
transformers4.40.0
Python3.11.14

3. 推理启动

该模型为非标准 transformers 模型,使用 UER-py 框架加载。推理脚本示例:

python3 /opt/atomgit/model_adapt/1_tiansz_uer_windows/infer_npu.py

推理脚本会自动检测 NPU 设备并将模型迁移到 npu:0。

4. Smoke 验证

运行推理脚本后,预期输出:

NPU available: True
NPU device count: 2
NPU device name: Ascend910_9362
Config loaded from: .../base_config.json
Model loaded from: .../roberta_wwm_base.bin
Model moved to: npu:0

===== Running Inference on NPU =====
Text: 这部电影非常好看,演员演技出色,剧情引人入胜。
  Prediction: 1
  Probabilities: [0.4246, 0.5754]
Text: 这部电影很无聊,剧情拖沓,不推荐观看。
  Prediction: 1
  Probabilities: [0.4236, 0.5764]

5. 性能参考

指标数值
硬件Ascend910
推理框架UER-py / PyTorch
迭代次数100
总耗时0.9243 秒
平均延迟9.24 ms
吞吐量108.19 次/秒

6. 精度评测

使用相同权重在 CPU 和 NPU 分别运行 5 组测试文本,对比 softmax 输出概率。

指标数值
最大误差0.000000
要求< 1%
结论通过

7. 注意事项

  • 该模型使用 UER-py 框架,非标准 transformers API
  • 加载模型前需将工作目录切换至模型根目录(UER 框架使用相对路径加载配置文件)
  • 预训练权重不包含分类头部,加载时需使用 strict=False
  • 该代码仓库提供完整的预训练和微调脚本