HuggingFace镜像/DPRNNTasNet-ks16_WHAM_sepclean
模型介绍文件和版本分析

Asteroid 模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean

♻️ 从 https://zenodo.org/record/3903795#.X8pMBRNKjUI 导入

该模型由 Manuel Pariente 使用 Asteroid 中的 wham/DPRNN 方案训练而成。它在 WHAM! 数据集的 sep_clean 任务上进行了训练。

演示:如何在 Asteroid 中使用

# coming soon

训练配置

  • 数据:
    • 模式:min
    • 非默认声源数量:None
    • 采样率:8000
    • 片段时长:2.0
    • 任务:sep_clean
    • 训练目录:data/wav8k/min/tr
    • 验证目录:data/wav8k/min/cv
  • 滤波器组:
    • 核大小:16
    • 滤波器数量:64
    • 步长:8
  • 主要参数:
    • 实验目录:exp/train_dprnn_ks16/
    • 帮助:None
  • 掩码网络:
    • 双向:True
    • 批归一化通道数:128
    • 块大小:100
    • 丢弃率:0
    • 隐藏层大小:128
    • 跳跃大小:50
    • 输入通道数:64
    • 掩码激活函数:sigmoid
    • 重复次数:6
    • 声源数量:2
    • 输出通道数:64
  • 优化器:
    • 学习率:0.001
    • 优化器:adam
    • 权重衰减:1e-05
  • 位置参数:
  • 训练:
    • 批大小:6
    • 早停:True
    • 轮次:200
    • 梯度裁剪:5
    • 学习率减半:True
    • 工作进程数:6

结果

  • si_sdr:18.227683982688003
  • si_sdr_imp:18.22883576588251
  • sdr:18.617789605060587
  • sdr_imp:18.466745426438173
  • sir:29.22773720052717
  • sir_imp:29.07669302190474
  • sar:19.116352171914485
  • sar_imp:-130.06009796503054
  • stoi:0.9722025377865715
  • stoi_imp:0.23415680987800583

引用Asteroid

@inproceedings{Pariente2020Asteroid,
    title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
    author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
            Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
            Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
            and Emmanuel Vincent},
    year={2020},
    booktitle={Proc. Interspeech},
}

或在 arXiv 上:

@misc{pariente2020asteroid,
      title={Asteroid: the PyTorch-based audio source separation toolkit for researchers}, 
      author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
      year={2020},
      eprint={2005.04132},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}
下载使用量0