S

Sepformer Whamr Enhancement

由speechbrain開發
該模型通過SepFormer架構實現語音增強(去噪+去混響),在WHAMR!數據集(8kHz)上預訓練,測試集SI-SNR達10.59dB。
下載量 570
發布時間 : 3/2/2022

模型概述

基於Transformer的語音增強模型,專門用於處理含環境噪聲和混響的語音信號,可同時進行去噪和去混響處理。

模型特點

雙任務處理
可同時處理語音去噪和去混響兩個任務
Transformer架構
採用SepFormer架構,利用注意力機制實現高效語音分離
低採樣率優化
專門針對8kHz採樣率的語音信號優化

模型能力

語音去噪
語音去混響
音頻質量增強

使用案例

語音處理
通話質量增強
提升嘈雜環境下的語音通話清晰度
SI-SNR提升10.59dB,PESQ達2.84
會議錄音增強
改善會議室等混響嚴重場景的錄音質量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase