W

Wsj0 2mix Skim Small Causal

lichendaによって開発
これはESPnetフレームワークで訓練された音声強調モデルで、wsj0_2mixデータセットの混合音声信号分離タスクに特化しています。
ダウンロード数 26
リリース時間 : 5/17/2023

モデル概要

このモデルはskimアーキテクチャを採用し、因果性処理能力を持ち、リアルタイム音声強調シナリオに適しており、混合音声中の異なる話者信号を効果的に分離できます。

モデル特徴

因果処理能力
モデルは因果構造設計を採用し、リアルタイム音声処理アプリケーションに適しています
軽量アーキテクチャ
小型skimアーキテクチャ設計で、性能を維持しながら計算複雑度を低減
複数話者分離
混合音声中の2つの話者信号を効果的に分離可能

モデル能力

音声強調
話者分離
リアルタイム音声処理

使用事例

音声通信
会議音声強調
複数人会議シナリオで異なる話者の声を分離
STOI指標94.20、SDR指標14.33を達成
音声認識前処理
ASRフロントエンド処理
音声認識システムによりクリーンな入力信号を提供
騒音環境での音声認識システムの精度向上が可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase