iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline 在昇腾 NPU 上的部署

模型信息

模型名称：iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline
任务类型：语音自动识别
模型架构：UniASR（FunASR，双阶段离线）
来源：ModelScope（阿里巴巴达摩院）
输入音频：16kHz 单声道 WAV
输出：中文语音识别文本

验证环境

硬件：昇腾 910（Ascend910_9362）
CANN：8.5.1
Python：3.11.14
PyTorch：2.9.0+cpu
torch_npu：2.9.0.post1+gitee7ba04
funasr：1.3.1

ModelScope 下载说明

pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline')"

音频预处理说明

输入音频格式：16kHz，单声道，WAV

使用 model_utils.load_wav() 加载音频，支持 torchaudio/soundfile/wave 三层 fallback。

NPU 推理命令

pip install -r requirements.txt
python inference.py

NPU 推理输出

Model: iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline
Audio: assets/test.wav
NPU transcription: 欢迎大家来体验达摩院推出的语音识别模型

日志保存在 logs/inference.log。

CPU-NPU 精度一致性结果

指标	数值
max_abs_error	0.023046
mean_abs_error	0.000784
relative_error	0.0170%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU-NPU 相对误差为 0.0170%，远低于 1.0% 阈值，精度一致性验证通过。

Benchmark 结果

指标	数值
平均延迟	1652.08 ms
最小延迟	1613.83 ms
最大延迟	1791.25 ms
P50	1639.75 ms
P90	1682.72 ms
P95	1736.99 ms
音频时长	5.55 s
RTF	0.2978

工程结构

.
├── assets/
│   └── test.wav
├── logs/
│   ├── inference.log
│   ├── eval_consistency.log
│   └── benchmark.log
├── screenshots/
│   ├── self_verification.txt
│   └── self_verification.png
├── model_utils.py
├── inference.py
├── eval_consistency.py
├── benchmark.py
├── requirements.txt
├── .gitignore
└── README.md

运行说明

安装依赖：pip install -r requirements.txt
运行推理：python inference.py
运行一致性验证：python eval_consistency.py
运行性能测试：python benchmark.py

.
├── assets/
│   └── test.wav
├── logs/
│   ├── inference.log
│   ├── eval_consistency.log
│   └── benchmark.log
├── screenshots/
│   ├── self_verification.txt
│   └── self_verification.png
├── model_utils.py
├── inference.py
├── eval_consistency.py
├── benchmark.py
├── requirements.txt
├── .gitignore
└── README.md

iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline 在昇腾 NPU 上的部署

模型信息

验证环境

ModelScope 下载说明

音频预处理说明

NPU 推理命令

NPU 推理输出

CPU-NPU 精度一致性结果

Benchmark 结果

工程结构

运行说明

标签

iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline 在昇腾 NPU 上的部署

模型信息

验证环境

ModelScope 下载说明

音频预处理说明

NPU 推理命令

NPU 推理输出

CPU-NPU 精度一致性结果

Benchmark 结果

工程结构

运行说明

标签