🚀 Asteroidモデル mpariente/DPRNNTasNet(ks=16)_WHAM!_sepclean
♻️ https://zenodo.org/record/3903795#.X8pMBRNKjUI からインポートされました。
このモデルは、Manuel ParienteによってAsteroidのwham/DPRNNレシピを使用してトレーニングされました。WHAM!データセットのsep_cleanタスクでトレーニングされました。
🚀 クイックスタート
このモデルは、音声ソース分離のために設計されており、Asteroidフレームワークを使用してトレーニングされました。以下のセクションでは、このモデルの使用方法とトレーニング設定について説明します。
✨ 主な機能
- WHAM!データセットのsep_cleanタスクでトレーニングされた音声ソース分離モデル。
- Asteroidフレームワークを使用して開発されている。
📦 インストール
インストールに関する具体的な手順は提供されていません。
💻 使用例
基本的な使用法
高度な使用法
📚 ドキュメント
トレーニング設定
プロパティ |
詳細 |
データ設定 |
モード: min、サンプルレート: 8000、セグメント: 2.0、タスク: sep_clean など |
フィルタバンク設定 |
カーネルサイズ: 16、フィルタ数: 64、ストライド: 8 |
マスクネットワーク設定 |
双方向: True、隠れ層サイズ: 128 など |
オプティマイザ設定 |
学習率: 0.001、オプティマイザ: adam、重み減衰: 1e-05 |
トレーニング設定 |
バッチサイズ: 6、エポック数: 200 など |
結果
指標 |
値 |
si_sdr |
18.227683982688003 |
si_sdr_imp |
18.22883576588251 |
sdr |
18.617789605060587 |
sdr_imp |
18.466745426438173 |
sir |
29.22773720052717 |
sir_imp |
29.07669302190474 |
sar |
19.116352171914485 |
sar_imp |
-130.06009796503054 |
stoi |
0.9722025377865715 |
stoi_imp |
0.23415680987800583 |
Asteroidの引用
@inproceedings{Pariente2020Asteroid,
title={Asteroid: the {PyTorch}-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and
Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and
Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge
and Emmanuel Vincent},
year={2020},
booktitle={Proc. Interspeech},
}
またはarXivでの引用:
@misc{pariente2020asteroid,
title={Asteroid: the PyTorch-based audio source separation toolkit for researchers},
author={Manuel Pariente and Samuele Cornell and Joris Cosentino and Sunit Sivasankaran and Efthymios Tzinis and Jens Heitkaemper and Michel Olvera and Fabian-Robert Stöter and Mathieu Hu and Juan M. Martín-Doñas and David Ditter and Ariel Frank and Antoine Deleforge and Emmanuel Vincent},
year={2020},
eprint={2005.04132},
archivePrefix={arXiv},
primaryClass={eess.AS}
}
📄 ライセンス
このモデルはCC BY-SA 4.0ライセンスの下で提供されています。