g
gyccc/iic-speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline 在昇腾 NPU 上的部署

模型信息

  • 模型名称:iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline
  • 任务类型:自动语音识别(Automatic Speech Recognition)
  • 模型架构:UniASR (FunASR)
  • 来源:ModelScope

验证环境

  • 硬件:昇腾 910B
  • CANN:8.5.1
  • Python:3.11.14
  • torch_npu:适配 CANN 8.5.1

ModelScope 下载说明

pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline')"

音频预处理说明

输入音频格式:16kHz,单声道,WAV

使用 model_utils.load_wav() 加载音频,支持 torchaudio/soundfile/wave 三层降级备用。

NPU 推理命令

pip install -r requirements.txt
python inference.py

NPU 推理输出

Model: iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline
Audio: assets/test.wav
NPU transcription: 供給量が減る と あ る程度は仕方な い ん じ ゃ ね転売の価格は論外だ け ど お

日志保存在 logs/inference.log。

CPU-NPU 精度一致性结果

指标数值
max_abs_error0.017444
mean_abs_error0.000257
relative_error0.0143%
cosine_similarity1.000000
threshold1.0%
结果PASS

Benchmark 结果

指标数值
平均延迟1704.71 ms
最小延迟1639.36 ms
最大延迟1742.87 ms
P501711.83 ms
P901741.57 ms
P951742.22 ms
音频时长6.27 s
RTF0.2721

工程结构

.
├── assets/
│   └── test.wav
├── logs/
│   ├── env_check.log
│   ├── inference.log
│   ├── eval_consistency.log
│   └── benchmark.log
├── screenshots/
│   └── self_verification.txt
├── model_utils.py
├── inference.py
├── eval_consistency.py
├── benchmark.py
├── requirements.txt
├── .gitignore
└── README.md

运行说明

  1. 安装依赖:pip install -r requirements.txt
  2. 运行推理:python inference.py
  3. 运行一致性验证:python eval_consistency.py
  4. 运行性能测试:python benchmark.py

标签

#NPU #Ascend #ASR #FunASR #UniASR #Japanese