针对 Apple Neural Engine 的 Silero VAD v5 CoreML 转换版本。
| 详情 | 值 |
|---|---|
| 架构 | STFT → Conv1d 编码器 → LSTM → 解码器 |
| 参数数量 | ~309K |
| 输入 | 512 个样本(16kHz 下 32ms) |
| 输出 | 语音概率(0.0–1.0) |
| 大小 | ~4.2 MB |
let vad = try await SileroVADModel.fromPretrained(backend: .coreML)
let prob = vad.processChunk(samples)| 变体 | 后端 | 模型 ID |
|---|---|---|
| MLX | GPU | aufklarer/Silero-VAD-v5-MLX |
| CoreML | Neural Engine | aufklarer/Silero-VAD-v5-CoreML |