YJwan123/fsmn-vad
模型介绍文件和版本Pull Requests讨论分析

speech_fsmn_vad_zh-cn-16k-common-pytorch on Ascend NPU

1. 简介

本文档展示 iic/speech_fsmn_vad_zh-cn-16k-common-pytorch 模型在昇腾 NPU 平台上的适配评测结果。

  • 模型来源: iic/speech_fsmn_vad_zh-cn-16k-common-pytorch
  • 适配状态: SUCCESS
  • 适配时间: 2026-05-20

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
  • NPU: Ascend 910B4
  • 系统: Ubuntu 22.04.5 LTS (aarch64)

3. 推理脚本

python inference.py --model-id iic/speech_fsmn_vad_zh-cn-16k-common-pytorch --device npu:0

4. Smoke 验证

指标结果
输出形状[1, 50, 248]
推理状态SUCCESS ✅

5. 性能参考

指标数值
平均延迟0.86 ms

6. 精度评测

✅ NPU vs CPU 精度对比

指标数值
Cosine Similarity1.0
精度误差0.0%
是否满足要求是(< 1%)✅

7. 评测材料

材料文件说明
推理脚本inference.pyNPU 推理代码
精度报告report.json结构化评测数据

8. Agent Skill

  • 模型类型: 语音活动检测 (Voice Activity Detection)
  • 框架: PyTorch
  • 输入尺寸: [1, 50, 400]
  • 输出尺寸: [1, 50, 248]
  • 推理精度: float32

9. 注意事项

  • 首次运行需从 ModelScope 下载模型权重文件
  • 推荐在 NPU 设备上运行以充分发挥硬件性能

参赛赛道: 模型适配赛道 提交时间: 2026-05-20

下载使用量0