本文档记录 d4data/biomedical-ner-all 在 Ascend 910B3 NPU 环境下的适配与验证结果。该模型是一个基于 DistilBERT 的生物医学命名实体识别(NER)模型,可识别 83 种实体类型(包括疾病、药物、症状、检查、手术等)。
本仓库提供:
相关获取地址:
| 组件 | 版本 |
|---|---|
torch | 2.8.0 |
torch_npu | 2.8.0.post4 |
transformers | 4.57.6 |
Ascend 910B3,1 逻辑卡DistilBertForTokenClassification(6 层,768 隐藏维,12 注意力头)83 种 BIO 标注标签512pip install torch torch_npu transformers
export ASCEND_RT_VISIBLE_DEVICES=0python inference.py --text "The patient was diagnosed with diabetes and prescribed metformin."python inference.py --input-file texts.txt{
"model": "d4data--biomedical-ner-all",
"device": "npu:0",
"num_texts": 1,
"results": [
{
"text": "The patient was diagnosed with diabetes...",
"entities": [
{"entity": "Disease_disorder", "text": "diabetes"},
{"entity": "Medication", "text": "metformin"}
]
}
]
}python inference.py --text "The patient has hypertension and takes lisinopril."| 指标 | CPU | NPU |
|---|---|---|
| 平均推理时间 | 0.1885 s | 0.0138 s |
| 吞吐量 | 53.06 texts/s | 722.46 texts/s |
| 加速比 | - | 13.66x |
精度评测采用 Token 级标注准确率作为指标。
| 指标 | 数值 |
|---|---|
| 测试样本数 | 10 |
| 总 Token 数 | 199 |
| 匹配 Token 数 | 198 |
| Token 准确率 | 99.50% |
| 错误率 | 0.50% |
| 精度要求(错误率 < 1%) | 通过 |
结论:NPU 与 CPU 的 token 级实体标注一致率达 99.50%,错误率 0.50% 低于 1% 阈值,精度通过验证。
##form、##lit),输出中会合并显示。