本文档记录 deepset_all-mpnet-base-v2-table 在昇腾 NPU(Ascend910)环境的快速部署与验证结果。文本嵌入模型。
NPU 与 CPU logits 数值一致性对比:
NPU:6.95 毫秒(batch=8,max_length=128)