S

Sepformer Wham16k Enhancement

由speechbrain開發
這是一個使用SepFormer架構的語音增強模型,專門用於去除音頻中的噪聲和混響,在WHAM!數據集上以16kHz採樣頻率訓練。
下載量 5,140
發布時間 : 6/30/2022

模型概述

該模型基於Transformer架構的SepFormer實現,主要用於語音增強任務,能夠有效去除音頻中的環境噪聲和混響效果。

模型特點

高效去噪
能夠有效去除音頻中的環境噪聲和混響效果
基於Transformer架構
採用先進的SepFormer架構,結合自注意力機制進行語音分離
16kHz高採樣率
支持16kHz採樣頻率的音頻處理,提供更高質量的音頻增強效果

模型能力

音頻去噪
語音增強
混響消除

使用案例

音頻處理
語音增強
對含有環境噪聲的語音進行清晰度增強
SI-SNR提升至14.3dB,PESQ達到2.20
會議錄音處理
去除會議錄音中的背景噪聲和房間混響
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase