HuggingFace镜像/Silero-VAD-v5-CoreML
模型介绍文件和版本分析
下载使用量0

Silero-VAD-v5 — CoreML

针对 Apple Neural Engine 的 Silero VAD v5 CoreML 转换版本。

模型详情

详情值
架构STFT → Conv1d 编码器 → LSTM → 解码器
参数数量~309K
输入512 个样本(16kHz 下 32ms)
输出语音概率(0.0–1.0)
大小~4.2 MB

用法

let vad = try await SileroVADModel.fromPretrained(backend: .coreML)
let prob = vad.processChunk(samples)

变体

变体后端模型 ID
MLXGPUaufklarer/Silero-VAD-v5-MLX
CoreMLNeural Engineaufklarer/Silero-VAD-v5-CoreML

链接

  • Swift 库: soniqo/speech-swift
  • 原始模型: snakers4/silero-vad


  • 指南: soniqo.audio/guides/vad
  • 文档: soniqo.audio
  • GitHub: soniqo/speech-swift