xujiashuai/timm-nlp_corom_sentence-embedding_chinese-base-ecom
模型介绍文件和版本Pull Requests讨论分析

nlp_corom_sentence-embedding_chinese-base-ecom - 昇腾 NPU 适配

1. 模型简介

基于 CoRoM(Context-aware Robust Model,上下文感知鲁棒模型)的中文电商领域句子嵌入模型,采用 BERT-base 架构,适用于电商场景下的语义相似度计算与检索任务。

  • 原始模型:iic/nlp_corom_sentence-embedding_chinese-base-ecom
  • 框架:PyTorch + Transformers
  • 任务:Sentence Embedding(电商领域)
  • Backbone:BERT-base(12 层,768 隐藏维度)

2. 昇腾 NPU 适配结果

指标值
余弦相似度0.999992
最大绝对误差0.008105
平均延迟6.96ms
输出维度(1, T, 768)
推理精度float32
设备Ascend 910B4

3. 环境要求

组件版本
CANN8.5.1
torch_npu2.9.0.post1
PyTorch2.9.0
Python3.11
transformerslatest
modelscopelatest

4. 快速使用

export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH

python inference.py
python evaluate.py

5. 推理输出证据

Model: iic/nlp_corom_sentence-embedding_chinese-base-ecom
Device: npu:0
Output shape: [1, 25, 768]
Output sample: [0.3923669755458832, -0.1256464123725891, -0.12140969187021255, 0.31653329730033875, 0.42105892300605774]
Latency: 6.96ms

--- CPU vs NPU 精度对比 ---
Cosine Similarity: 0.999992
Max Abs Error: 0.008105
SUCCESS

6. CPU 与 NPU 精度对比

指标CPU (float32)NPU (float32)误差
余弦相似度基准0.999992< 0.00001
最大绝对误差-0.008105-
输出维度(1, 25, 768)(1, 25, 768)一致

7. 模型结构

  • 骨干网络:BERT-base(12 层)
  • 隐藏层大小:768
  • 注意力头数:12
  • 最大位置数:512
  • 词汇表大小:21128
  • 池化方式:first_token_transform
下载使用量0