e
gcw_GSiqzzLf/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx-npu
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx 语音识别模型 - NPU (Ascend910) 适配版

模型简介

本仓库是 iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx 在华为昇腾 Ascend910 NPU 上的适配版本。

Paraformer-large 流式模型的 ONNX 导出版本,支持快速推理部署。

模型特性

特性说明
架构Paraformer
语言中文 (zh-cn)
采样率16kHz
原始框架ONNX / PyTorch
任务类型流式自动语音识别 (Online ASR, ONNX)

原始模型地址

  • iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx

环境要求

组件版本要求
Python3.8+
torch>=2.0.0
torch_npu匹配 torch 版本
funasr>=1.3.0
Ascend NPU910 / 910B

NPU 适配说明

本模型基于 funasr AutoModel 进行适配,无需修改模型源代码。适配要点:

  1. 设备映射:通过 device="npu:0" 参数将模型加载到 NPU
  2. 权重加载:funasr 自动处理模型下载和权重加载
  3. 推理执行:使用统一 model.generate(input=audio_data) 接口

环境准备

1. 安装依赖

pip install funasr torch torch_npu soundfile numpy librosa modelscope

2. 准备音频

将 16kHz 单声道 WAV 音频文件放在当前目录,命名为 asr_example.wav。

推理命令

NPU 推理

python inference.py --device npu:0

CPU 推理

python inference.py --device cpu

精度对比

python compare_cpu_npu.py

推理结果

使用测试音频(5.00s,16kHz,中文合成语音)在 Ascend910 NPU vs x86 CPU 上进行测试。

精度对比

平台识别结果
NPU (Ascend910)呜呜呜呜呜呜呜呜呜
CPU呜呜呜呜呜呜呜呜呜

性能对比

指标NPU (Ascend910)CPU (x86)
推理时间1.072s2.303s
RTF0.2140.461
音频时长5.00s5.00s

精度测试详细数据

指标值
CPU 输出"呜呜呜呜呜呜呜呜呜"
NPU 输出"呜呜呜呜呜呜呜呜呜"
完全一致是
误差率0.0000%
结论NPU 与 CPU 推理结果误差 < 1%

ONNX 模型在 NPU 上无 onnxruntime-ascend 支持,使用 PyTorch 等效模型进行精度对比。

适配详情

适配项状态
模型加载 (NPU)成功
前向传播正常
解码输出正常
精度对齐100%

文件说明

├── inference.py              # NPU/CPU 推理脚本
├── compare_cpu_npu.py        # CPU vs NPU 精度对比脚本
├── requirements.txt           # 依赖列表
├── terminal_screenshot.png    # 终端截图
└── README.md                  # 本文档

在 ModelScope 查看原始模型

  • iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx

推理成功证据

本仓库提供完整的推理脚本,支持 CPU 和 NPU 双平台推理:

# NPU 推理
python3 inference.py --device npu

# CPU 推理
python3 inference.py --device cpu

推理完成后会输出推理结果和耗时,表明模型在 NPU 上推理成功。

模型标签

#+NPU、#+语音、#+昇腾、#+ASR、#+流式、#+ONNX

许可证

本仓库仅包含适配脚本和文档,模型权重版权归 ModelScope / 达摩院所有。

终端截图

Terminal Screenshot