R

Resepformer Wsj02mix

speechbrainによって開発
これはRE - SepFormerアーキテクチャに基づくオーディオソース分離モデルで、SpeechBrainによって実装され、WSJ0 - 2Mixデータセットで訓練されました。
ダウンロード数 488
リリース時間 : 6/19/2022

モデル概要

このモデルはオーディオソース分離タスクに使用され、混合オーディオ中の異なるソースを分離することができます。

モデル特徴

効率的な分離
RE - SepFormerアーキテクチャを採用し、リソース効率の高いオーディオソース分離を実現します。
高性能
WSJ0 - 2Mixテストセットで18.6 dBのSI - SNRi性能を達成します。
使いやすさ
簡単なPythonインターフェースを提供し、既存のシステムに容易に統合できます。

モデル能力

オーディオソース分離
音声信号処理

使用事例

オーディオ処理
音声分離
混合オーディオから異なる話者の音声を分離します。
SI - SNRi 18.6 dB, SDRi 18.9 dB
オーディオ強化
背景ノイズから目標音声信号を抽出します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase