W

Wsj0 2mix Skim Small Causal

由lichenda開發
這是一個基於ESPnet框架訓練的語音增強模型,專門用於處理wsj0_2mix數據集中的混合語音信號分離任務。
下載量 26
發布時間 : 5/17/2023

模型概述

該模型採用skim架構,具有因果性處理能力,適用於即時語音增強場景,能夠有效分離混合語音中的不同說話人信號。

模型特點

因果處理能力
模型採用因果結構設計,適合即時語音處理應用場景
輕量級架構
小型skim架構設計,在保持性能的同時降低計算複雜度
多說話人分離
能夠有效分離混合語音中的兩個說話人信號

模型能力

語音增強
說話人分離
即時語音處理

使用案例

語音通信
會議語音增強
在多人會議場景中分離不同說話人的聲音
STOI指標達到94.20,SDR指標14.33
語音識別預處理
ASR前端處理
為語音識別系統提供更乾淨的輸入信號
可提升語音識別系統在嘈雜環境中的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase