.nemo| 组件 | 版本 |
|---|---|
| NPU | Ascend 910B4 |
| CANN | 8.5.1 |
| PyTorch | 2.9.0 |
| torch_npu | ✓ |
| NeMo | ✓ |
parakeet-tdt-0.6b-v3+ascend/
├── inference.py # 单次推理脚本
├── accuracy_run.py # 精度 & 性能验证(NPU vs CPU 对比)
├── accuracy_run_perf.py # 纯性能基准测试
├── check_accuracy_run_perf.py # 多合一烟测试 + 结果校验
├── sample.wav # 测试音频(7.4s 英文)
├── log.txt # 验证日志
└── README.md # 本文档python3 check_accuracy_run_perf.py --dry-runpython3 inference.py sample.wavpython3 inference.py sample.wav --timestampspython3 accuracy_run.py --audio sample.wavpython3 accuracy_run_perf.py --audio sample.wav --runs 10python3 check_accuracy_run_perf.py --audio sample.wav| 指标 | 结果 |
|---|---|
| NPU 转录 | ✅ Well, I don't wish to see it any more, observed Phoebe, turning away her eyes... |
| CPU 转录 | ✅ Well, I don't wish to see it any more, observed Phoebe, turning away her eyes... |
| 精确匹配 | ✅ 100% |
| CER | 0.0000 |
| 误差要求 (< 1%) | ✅ MET |
结论: NPU 输出与 CPU 参考完全一致,精度误差远低于 1% 要求。
| 指标 | 值 |
|---|---|
| 音频长度 | 7.4s |
| 首次推理(含加载) | 19.47s |
| 稳态平均延迟 | 0.247s |
| 稳态 RTFx | 30.1x |
| P90 延迟 | 0.248s |
该模型的 Ascend NPU 适配遵循以下模式:
.nemo 文件(约 2.5GB)ASRModel.restore_from() 加载model.to('npu:0') 将模型移至 NPUmodel.transcribe() 进行语音识别该模型无需额外适配——NeMo 原生支持 NPU 推理,
torch.npu自动接管算子执行。