S

Sepformer Libri3mix

speechbrainによって開発
これはSepFormerアーキテクチャに基づく音源分離モデルで、Libri3Mixデータセットでトレーニングされ、混合音声を複数の独立した音源に分離できます。
ダウンロード数 1,511
リリース時間 : 9/16/2022

モデル概要

このモデルはSepFormerアーキテクチャを使用して音源分離機能を実現し、混合音声シナリオに特化して設計されており、混合オーディオから独立した音声源を分離できます。

モデル特徴

高性能分離能力
Libri3Mixテストセットで19.8 dB SI-SNRiの分離性能を達成
トランスフォーマーアーキテクチャベース
先進的なSepFormerアーキテクチャを採用し、自己注意メカニズムを利用して効率的な分離を実現
マルチスピーカー分離
混合オーディオ内の複数の話者音声を同時に分離可能

モデル能力

音源分離
マルチスピーカー音声分離
8kHzオーディオ処理

使用事例

音声処理
会議録音分離
複数人の会議録音を独立した話者オーディオに分離
3つの同時発話音源を明確に分離可能
音声強調
背景ノイズから明瞭な音声を抽出
音声認識精度の向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase