weixin_72661020/NeuML_pubmedbert-base-colbert
模型介绍文件和版本Pull Requests讨论分析

NeuML_pubmedbert-base-colbert

1. 简介

本文档记录 NeuML_pubmedbert-base-colbert 在昇腾 NPU(Ascend910)环境的快速部署与验证结果。文本嵌入模型,基于 HuggingFace transformers 框架。

2. 快速部署

参考 inference.py。

3. 精度评测

NPU vs CPU logits 数值一致性对比(PASS)。

4. 性能参考

NPU: 6.95 ms (batch=8, max_length=128)

下载使用量0