🚀 Asteroid模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean
本模型由Asteroid团队开发,用于音频源分离任务。它基于Transformer架构,在WHAM!数据集上进行训练,能够有效分离音频中的不同声源,提升音频处理的质量和效率。
🚀 快速开始
此模型由Manuel Pariente使用Asteroid中的wham/DPRNN配方进行训练。它在WHAM!数据集的sep_clean任务上进行了训练。
♻️ 从https://zenodo.org/record/3903795#.X8pMBRNKjUI 导入
💻 使用示例
基础用法
📚 详细文档
训练配置
- 数据:
- 模式:min
- 非默认源数量:None
- 采样率:8000
- 片段长度:2.0
- 任务:sep_clean
- 训练数据目录:data/wav8k/min/tr
- 验证数据目录:data/wav8k/min/cv
- 滤波器组:
- 主要参数:
- 实验目录:exp/train_dprnn_ks16/
- 帮助信息:None
- 掩码网络:
- 双向:True
- 批量归一化通道数:128
- 块大小:100
- 丢弃率:0
- 隐藏层大小:128
- 跳跃大小:50
- 输入通道数:64
- 掩码激活函数:sigmoid
- 重复次数:6
- 源数量:2
- 输出通道数:64
- 优化器:
- 学习率:0.001
- 优化器类型:adam
- 权重衰减:1e-05
- 位置参数:无
- 训练:
- 批量大小:6
- 提前停止:True
- 训练轮数:200
- 梯度裁剪:5
- 学习率减半:True
- 工作进程数:6
结果
指标 |
值 |
si_sdr |
18.227683982688003 |
si_sdr_imp |
18.22883576588251 |
sdr |
18.617789605060587 |
sdr_imp |
18.466745426438173 |
sir |
29.22773720052717 |
sir_imp |
29.07669302190474 |
sar |
19.116352171914485 |
sar_imp |
-130.06009796503054 |
stoi |
0.9722025377865715 |
stoi_imp |
0.23415680987800583 |
📄 许可证
本项目采用CC BY-SA 4.0许可证。
📖 引用Asteroid
如果您使用了该模型,请引用以下文献:
@inproceedings{Pariente2020Asteroid,
title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
and Emmanuel Vincent},
year={2020},
booktitle={Proc. Interspeech},
}
或者引用arXiv上的版本:
@misc{pariente2020asteroid,
title={Asteroid: the PyTorch-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
year={2020},
eprint={2005.04132},
archivePrefix={arXiv},
primaryClass={eess.AS}
}