S

Sepformer Dns4 16k Enhancement

由speechbrain開發
這是一個基於SepFormer架構的語音增強模型,專門用於去噪任務,在微軟DNS-4數據集上訓練,支持16kHz採樣頻率的音頻處理。
下載量 1,669
發布時間 : 8/6/2023

模型概述

該模型使用SepFormer架構實現語音增強功能,主要用於去除音頻中的背景噪聲,提高語音質量。模型在1300小時的微軟DNS 4數據集上訓練,適用於16kHz採樣頻率的音頻。

模型特點

高性能去噪
在DNS4 2022基線開發集上表現出色,DNSMOS SIG得分2.999,BAK得分3.076,OVRL得分2.437
多語言支持
支持包括英文、德文、俄文、法文、意大利文和西班牙文在內的多種語言
基於Transformer架構
採用先進的SepFormer架構,結合Transformer的優勢進行語音分離和增強

模型能力

音頻去噪
語音質量增強
背景噪聲抑制

使用案例

語音通信
VoIP通話增強
提高網絡語音通話質量,減少背景噪聲干擾
顯著改善通話清晰度
音頻後期處理
錄音去噪
對現場錄音進行降噪處理,提高語音可懂度
提升錄音質量,使語音更清晰
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase