speech_eres2net_base_five_lre_8k - 昇腾 NPU 适配

1. 模型简介

ERes2Net 语音语言识别模型，支持 5 种语言（粤语、英语、日语、韩语、中文），8kHz 采样率。

原始模型: iic/speech_eres2net_base_five_lre_8k
框架: PyTorch
任务: 语音语言识别（5 分类）

2. 昇腾 NPU 适配结果

指标	值
余弦相似度	1.000000
平均延迟	11.30 ms
推理精度	float32
设备	Ascend 910B4

3. 快速使用

export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float32

4. 推理输出证据

模型: iic/speech_eres2net_base_five_lre_8k
设备: npu:0
精度: float32
------------------------------------------------------------
  input: shape=torch.Size([1, 200, 80])
  logits: shape=torch.Size([1, 5])
  CPU pred: 4, NPU pred: 4

  Cosine Similarity (logits): 1.000000

✓ 推理完成
  平均延迟: 11.30 ms

5. CPU 与 NPU 精度对比

指标	CPU (float32)	NPU (float32)	误差
余弦相似度	基准	1.000000	0%
输出维度	[1,5]	[1,5]	一致
预测类别	4	4	一致

6. 智能体技能

本适配由 batch-adapter 自动完成。

speech_eres2net_base_five_lre_8k - 昇腾 NPU 适配

1. 模型简介

ERes2Net 语音语言识别模型，支持 5 种语言（粤语、英语、日语、韩语、中文），8kHz 采样率。

原始模型: iic/speech_eres2net_base_five_lre_8k
框架: PyTorch
任务: 语音语言识别（5 分类）

2. 昇腾 NPU 适配结果

指标	值
余弦相似度	1.000000
平均延迟	11.30 ms
推理精度	float32
设备	Ascend 910B4

3. 快速使用

export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float32

4. 推理输出证据

模型: iic/speech_eres2net_base_five_lre_8k
设备: npu:0
精度: float32
------------------------------------------------------------
  input: shape=torch.Size([1, 200, 80])
  logits: shape=torch.Size([1, 5])
  CPU pred: 4, NPU pred: 4

  Cosine Similarity (logits): 1.000000

✓ 推理完成
  平均延迟: 11.30 ms

5. CPU 与 NPU 精度对比

指标	CPU (float32)	NPU (float32)	误差
余弦相似度	基准	1.000000	0%
输出维度	[1,5]	[1,5]	一致
预测类别	4	4	一致

6. 智能体技能

本适配由 batch-adapter 自动完成。