S

Sepformer Wham Enhancement

由speechbrain開發
使用SepFormer模型進行語音增強(去噪)的工具集,在WHAM!數據集(8kHz採樣頻率版本)上預訓練,實現環境噪聲和混響的去除。
下載量 827
發布時間 : 3/2/2022

模型概述

該模型基於SepFormer架構,專門用於語音增強任務,能夠有效去除音頻中的環境噪聲和混響效果,提升語音清晰度。

模型特點

高效的語音去噪
能夠有效去除音頻中的環境噪聲和混響,提升語音清晰度。
基於Transformer的架構
採用SepFormer架構,利用自注意力機制實現高效的語音分離和增強。
預訓練模型
在WHAM!數據集上預訓練,可直接用於語音增強任務,無需額外訓練。

模型能力

語音去噪
語音增強
音頻處理

使用案例

語音處理
語音增強
去除錄音中的環境噪聲和混響,提升語音清晰度。
SI-SNR提升至14.35 dB,PESQ達到3.07。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase