pip install modelscope
python -c "from modelscope import snapshot_download; snapshot_download('iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline')"输入音频格式:16kHz,单声道,WAV
使用 model_utils.load_wav() 加载音频,支持 torchaudio/soundfile/wave 三层降级备用。
pip install -r requirements.txt
python inference.pyModel: iic/speech_UniASR_asr_2pass-ja-16k-common-vocab93-tensorflow1-offline
Audio: assets/test.wav
NPU transcription: 供給量が減る と あ る程度は仕方な い ん じ ゃ ね転売の価格は論外だ け ど お日志保存在 logs/inference.log。
| 指标 | 数值 |
|---|---|
| max_abs_error | 0.017444 |
| mean_abs_error | 0.000257 |
| relative_error | 0.0143% |
| cosine_similarity | 1.000000 |
| threshold | 1.0% |
| 结果 | PASS |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 1704.71 ms |
| 最小延迟 | 1639.36 ms |
| 最大延迟 | 1742.87 ms |
| P50 | 1711.83 ms |
| P90 | 1741.57 ms |
| P95 | 1742.22 ms |
| 音频时长 | 6.27 s |
| RTF | 0.2721 |
.
├── assets/
│ └── test.wav
├── logs/
│ ├── env_check.log
│ ├── inference.log
│ ├── eval_consistency.log
│ └── benchmark.log
├── screenshots/
│ └── self_verification.txt
├── model_utils.py
├── inference.py
├── eval_consistency.py
├── benchmark.py
├── requirements.txt
├── .gitignore
└── README.mdpip install -r requirements.txtpython inference.pypython eval_consistency.pypython benchmark.py#NPU #Ascend #ASR #FunASR #UniASR #Japanese