R

Resepformer Wsj02mix

由speechbrain開發
這是一個基於RE-SepFormer架構的音頻源分離模型,由SpeechBrain實現並在WSJ0-2Mix數據集上訓練。
下載量 488
發布時間 : 6/19/2022

模型概述

該模型用於音頻源分離任務,能夠將混合音頻中的不同聲源分離出來。

模型特點

高效分離
採用RE-SepFormer架構,實現了資源高效的音頻源分離
高性能
在WSJ0-2Mix測試集上達到18.6 dB的SI-SNRi性能
易於使用
提供簡單的Python接口,便於集成到現有系統中

模型能力

音頻源分離
語音信號處理

使用案例

音頻處理
語音分離
從混合音頻中分離出不同的說話人聲音
SI-SNRi 18.6 dB, SDRi 18.9 dB
音頻增強
從背景噪聲中提取目標語音信號
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase