ERes2Net 语音语言识别模型,支持 5 种语言(粤语、英语、日语、韩语、中文),8kHz 采样率。
| 指标 | 值 |
|---|---|
| 余弦相似度 | 1.000000 |
| 平均延迟 | 11.30 ms |
| 推理精度 | float32 |
| 设备 | Ascend 910B4 |
export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float32模型: iic/speech_eres2net_base_five_lre_8k
设备: npu:0
精度: float32
------------------------------------------------------------
input: shape=torch.Size([1, 200, 80])
logits: shape=torch.Size([1, 5])
CPU pred: 4, NPU pred: 4
Cosine Similarity (logits): 1.000000
✓ 推理完成
平均延迟: 11.30 ms| 指标 | CPU (float32) | NPU (float32) | 误差 |
|---|---|---|---|
| 余弦相似度 | 基准 | 1.000000 | 0% |
| 输出维度 | [1,5] | [1,5] | 一致 |
| 预测类别 | 4 | 4 | 一致 |
本适配由 batch-adapter 自动完成。