🚀 Asteroid模型 mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean
本模型由Asteroid團隊開發,用於音頻源分離任務。它基於Transformer架構,在WHAM!數據集上進行訓練,能夠有效分離音頻中的不同聲源,提升音頻處理的質量和效率。
🚀 快速開始
此模型由Manuel Pariente使用Asteroid中的wham/DPRNN配方進行訓練。它在WHAM!數據集的sep_clean任務上進行了訓練。
♻️ 從https://zenodo.org/record/3903795#.X8pMBRNKjUI 導入
💻 使用示例
基礎用法
📚 詳細文檔
訓練配置
- 數據:
- 模式:min
- 非默認源數量:None
- 採樣率:8000
- 片段長度:2.0
- 任務:sep_clean
- 訓練數據目錄:data/wav8k/min/tr
- 驗證數據目錄:data/wav8k/min/cv
- 濾波器組:
- 主要參數:
- 實驗目錄:exp/train_dprnn_ks16/
- 幫助信息:None
- 掩碼網絡:
- 雙向:True
- 批量歸一化通道數:128
- 塊大小:100
- 丟棄率:0
- 隱藏層大小:128
- 跳躍大小:50
- 輸入通道數:64
- 掩碼激活函數:sigmoid
- 重複次數:6
- 源數量:2
- 輸出通道數:64
- 優化器:
- 學習率:0.001
- 優化器類型:adam
- 權重衰減:1e-05
- 位置參數:無
- 訓練:
- 批量大小:6
- 提前停止:True
- 訓練輪數:200
- 梯度裁剪:5
- 學習率減半:True
- 工作進程數:6
結果
指標 |
值 |
si_sdr |
18.227683982688003 |
si_sdr_imp |
18.22883576588251 |
sdr |
18.617789605060587 |
sdr_imp |
18.466745426438173 |
sir |
29.22773720052717 |
sir_imp |
29.07669302190474 |
sar |
19.116352171914485 |
sar_imp |
-130.06009796503054 |
stoi |
0.9722025377865715 |
stoi_imp |
0.23415680987800583 |
📄 許可證
本項目採用CC BY-SA 4.0許可證。
📖 引用Asteroid
如果您使用了該模型,請引用以下文獻:
@inproceedings{Pariente2020Asteroid,
title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
and Emmanuel Vincent},
year={2020},
booktitle={Proc. Interspeech},
}
或者引用arXiv上的版本:
@misc{pariente2020asteroid,
title={Asteroid: the PyTorch-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
year={2020},
eprint={2005.04132},
archivePrefix={arXiv},
primaryClass={eess.AS}
}