本文档记录 AI-ModelScope/tao 在昇腾 NPU(Ascend910)环境的快速部署与验证结果。文本嵌入模型。
NPU: 6.95 ms (batch=8, max_length=128)