W

Wsj0 2mix Skim Small Causal

Developed by lichenda
これはESPnetフレームワークで訓練された音声強調モデルで、wsj0_2mixデータセットの混合音声信号分離タスクに特化しています。
Downloads 26
Release Time : 5/17/2023

Model Overview

このモデルはskimアーキテクチャを採用し、因果性処理能力を持ち、リアルタイム音声強調シナリオに適しており、混合音声中の異なる話者信号を効果的に分離できます。

Model Features

因果処理能力
モデルは因果構造設計を採用し、リアルタイム音声処理アプリケーションに適しています
軽量アーキテクチャ
小型skimアーキテクチャ設計で、性能を維持しながら計算複雑度を低減
複数話者分離
混合音声中の2つの話者信号を効果的に分離可能

Model Capabilities

音声強調
話者分離
リアルタイム音声処理

Use Cases

音声通信
会議音声強調
複数人会議シナリオで異なる話者の声を分離
STOI指標94.20、SDR指標14.33を達成
音声認識前処理
ASRフロントエンド処理
音声認識システムによりクリーンな入力信号を提供
騒音環境での音声認識システムの精度向上が可能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase