S

Sepformer Libri2mix

由speechbrain開發
使用SepFormer架構實現的音頻源分離模型,在Libri2Mix數據集上訓練,可分離混合音頻中的獨立聲源
下載量 783
發布時間 : 9/16/2022

模型概述

該模型基於Transformer架構(SepFormer),專門用於音頻源分離任務,能夠從混合音頻中分離出獨立的語音信號。

模型特點

高性能分離
在Libri2Mix測試集上達到20.6分貝的SI-SNRi性能
Transformer架構
採用先進的SepFormer架構,利用自注意力機制實現高效分離
易用集成
通過SpeechBrain框架提供簡單易用的接口

模型能力

音頻源分離
語音信號分離
混合音頻處理

使用案例

音頻處理
會議錄音分離
從多人會議錄音中分離出各個發言人的獨立音頻
可清晰分離不同說話人的聲音
音頻修復
從背景噪聲中提取清晰語音
提高語音清晰度和可懂度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase