DPRNNTasNet-ks16_WHAM_sepclean:可用于实现音频中不同声源的分离，项目是使用 Asteroid 工具包训练的 DPRNNTasNet 模型，基于 WHAM! 数据集 sep_clean 任务训练，具备较高的分离性能指标。【此简介由AI生成】

Asteroid 模型 `mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean`

♻️ 从 https://zenodo.org/record/3903795#.X8pMBRNKjUI 导入

该模型由 Manuel Pariente 使用 Asteroid 中的 wham/DPRNN 方案训练而成。它在 WHAM! 数据集的 sep_clean 任务上进行了训练。

演示：如何在 Asteroid 中使用

# coming soon

训练配置

数据：
- 模式：min
- 非默认声源数量：None
- 采样率：8000
- 片段时长：2.0
- 任务：sep_clean
- 训练目录：data/wav8k/min/tr
- 验证目录：data/wav8k/min/cv
滤波器组：
- 核大小：16
- 滤波器数量：64
- 步长：8
主要参数：
- 实验目录：exp/train_dprnn_ks16/
- 帮助：None
掩码网络：
- 双向：True
- 批归一化通道数：128
- 块大小：100
- 丢弃率：0
- 隐藏层大小：128
- 跳跃大小：50
- 输入通道数：64
- 掩码激活函数：sigmoid
- 重复次数：6
- 声源数量：2
- 输出通道数：64
优化器：
- 学习率：0.001
- 优化器：adam
- 权重衰减：1e-05
位置参数：
训练：
- 批大小：6
- 早停：True
- 轮次：200
- 梯度裁剪：5
- 学习率减半：True
- 工作进程数：6

结果

si_sdr：18.227683982688003
si_sdr_imp：18.22883576588251
sdr：18.617789605060587
sdr_imp：18.466745426438173
sir：29.22773720052717
sir_imp：29.07669302190474
sar：19.116352171914485
sar_imp：-130.06009796503054
stoi：0.9722025377865715
stoi_imp：0.23415680987800583

引用Asteroid

@inproceedings{Pariente2020Asteroid,
    title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
    author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
            Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
            Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
            and Emmanuel Vincent},
    year={2020},
    booktitle={Proc. Interspeech},
}

或在 arXiv 上：

@misc{pariente2020asteroid,
      title={Asteroid: the PyTorch-based audio source separation toolkit for researchers}, 
      author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
      year={2020},
      eprint={2005.04132},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

Asteroid 模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean

该模型由 Manuel Pariente 使用 Asteroid 中的 wham/DPRNN 方案训练而成。它在 WHAM! 数据集的 sep_clean 任务上进行了训练。

演示：如何在 Asteroid 中使用

# coming soon

训练配置

数据：

模式：min
非默认声源数量：None
采样率：8000
片段时长：2.0
任务：sep_clean
训练目录：data/wav8k/min/tr
验证目录：data/wav8k/min/cv

滤波器组：

核大小：16
滤波器数量：64
步长：8

主要参数：

实验目录：exp/train_dprnn_ks16/
帮助：None

掩码网络：

双向：True
批归一化通道数：128
块大小：100
丢弃率：0
隐藏层大小：128
跳跃大小：50
输入通道数：64
掩码激活函数：sigmoid
重复次数：6
声源数量：2
输出通道数：64

优化器：

学习率：0.001
优化器：adam
权重衰减：1e-05

位置参数：

训练：

批大小：6
早停：True
轮次：200
梯度裁剪：5
学习率减半：True
工作进程数：6

结果

si_sdr：18.227683982688003

si_sdr_imp：18.22883576588251

sdr：18.617789605060587

sdr_imp：18.466745426438173

sir：29.22773720052717

sir_imp：29.07669302190474

sar：19.116352171914485

sar_imp：-130.06009796503054

stoi：0.9722025377865715

stoi_imp：0.23415680987800583

引用Asteroid

@inproceedings{Pariente2020Asteroid,
    title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
    author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
            Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
            Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
            and Emmanuel Vincent},
    year={2020},
    booktitle={Proc. Interspeech},
}

或在 arXiv 上：

@misc{pariente2020asteroid,
      title={Asteroid: the PyTorch-based audio source separation toolkit for researchers}, 
      author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
      year={2020},
      eprint={2005.04132},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

Asteroid 模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean

演示：如何在 Asteroid 中使用

训练配置

结果

引用Asteroid

Asteroid 模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean

演示：如何在 Asteroid 中使用

训练配置

结果

引用Asteroid

Asteroid 模型 `mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean`

Asteroid 模型 `mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean`