StructBERT 中文情感分类模型,基于 BERT 架构(hidden_size=768,12层)。
| 指标 | 值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 平均延迟 | 6.87 ms |
| 推理精度 | float32 |
| 设备 | Ascend 910B4 |
export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float32模型: iic/nlp_structbert_sentiment-classification_chinese-base
设备: npu:0
精度: float32
------------------------------------------------------------
input_ids: shape=torch.Size([1, 8])
logits: shape=torch.Size([1, 2])
CPU pred: 1, NPU pred: 1
Cosine Similarity (logits): 1.000000
✓ 推理完成
平均延迟: 6.87 ms| 指标 | CPU (float32) | NPU (float32) | 误差 |
|---|---|---|---|
| 余弦相似度 | 基准 | 1.000000 | 0% |
| 输出维度 | [1,2] | [1,2] | 一致 |
| 预测类别 | 1 | 1 | 一致 |
本适配由 batch-adapter 自动完成。