S

Sepformer Libri2mix

speechbrainによって開発
SepFormerアーキテクチャを使用して実装された音源分離モデルで、Libri2Mixデータセットでトレーニングされ、混合オーディオから独立した音源を分離できます
ダウンロード数 783
リリース時間 : 9/16/2022

モデル概要

このモデルはTransformerアーキテクチャ(SepFormer)に基づいており、音源分離タスク専用に設計されており、混合オーディオから独立した音声信号を分離できます。

モデル特徴

高性能分離
Libri2Mixテストセットで20.6dBのSI-SNRi性能を達成
Transformerアーキテクチャ
先進的なSepFormerアーキテクチャを採用し、自己注意メカニズムを利用して効率的な分離を実現
使いやすい統合
SpeechBrainフレームワークを通じてシンプルで使いやすいインターフェースを提供

モデル能力

音源分離
音声信号分離
混合オーディオ処理

使用事例

オーディオ処理
会議録音分離
複数人の会議録音から各発言者の独立したオーディオを分離
異なる話者の声を明確に分離可能
オーディオ修復
バックグラウンドノイズからクリアな音声を抽出
音声の明瞭度と理解度を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase