nlp_corom_sentence-embedding_chinese-base 在昇腾 NPU 上的部署

1. 简介

指标	数值
平均延迟	8.20 毫秒
输出形状	[1, 128, 768]

使用 transformers BertModel.from_pretrained 直接加载预训练权重。输入为经过 tokenize 处理的文本（max_length=128）。

Model: iic/nlp_corom_sentence-embedding_chinese-base
Output shape: [1, 128, 768]
Latency: 8.20ms
Cosine Similarity: 0.999999
Max Abs Error: 0.003614

指标	CPU	NPU	差异
余弦相似度	1.0	0.999999	0%
最大绝对误差	-	0.003614	-

指标	数值
平均延迟	8.20 毫秒
输出形状	[1, 128, 768]

使用 transformers BertModel.from_pretrained 直接加载预训练权重。输入为经过 tokenize 处理的文本（max_length=128）。

Model: iic/nlp_corom_sentence-embedding_chinese-base
Output shape: [1, 128, 768]
Latency: 8.20ms
Cosine Similarity: 0.999999
Max Abs Error: 0.003614

指标	CPU	NPU	差异
余弦相似度	1.0	0.999999	0%
最大绝对误差	-	0.003614	-