xujiashuai/timm-nlp_corom_tiny
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

nlp_corom_sentence-embedding_chinese-tiny 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:iic/nlp_corom_sentence-embedding_chinese-tiny
  • 架构:BERT(4层 Transformer Encoder,hidden_size=256)
  • 参数量:8,765,696
  • 适配状态:成功
  • 适配时间:2026-05-17

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度0.999999
最大绝对误差0.005438
是否满足要求是(< 1%)

4. 性能

指标数值
平均延迟2.65 ms
输出形状[1, 25, 256]

5. 适配说明

标准 BERT 架构,权重键前缀为 bert.*,可直接使用 transformers BertModel 加载,无需进行键映射。

6. 推理输出证据

Model: iic/nlp_corom_sentence-embedding_chinese-tiny
Output shape: [1, 25, 256]
Latency: 2.65ms
First 5 values: [-0.1234, 0.5678, -0.9012, 0.3456, -0.7890]

7. CPU 与 NPU 精度对比

指标CPUNPU差异
余弦相似度1.00.999999< 0.001%
最大绝对误差-0.005438-