C

Convtasnet Libri2Mix Sepnoisy 8k

由JorisCos開發
基於Asteroid框架訓練的ConvTasNet模型,用於8kHz採樣率下的語音分離任務,特別針對含噪聲的混合語音場景。
下載量 31
發布時間 : 3/2/2022

模型概述

該模型採用ConvTasNet架構,在Libri2Mix數據集的'sep_noisy'任務上進行訓練,能夠從含噪聲的混合音頻中分離出清晰的語音信號。

模型特點

噪聲魯棒性
專門針對含噪聲的混合語音進行優化,能有效分離背景噪聲和語音信號
輕量級架構
採用ConvTasNet架構,在保持較高分離性能的同時具有較低計算複雜度
8kHz優化
專門針對8kHz採樣率的音頻進行優化,適用於電話語音等低帶寬場景

模型能力

語音分離
噪聲抑制
音頻增強

使用案例

語音通信
電話語音增強
提升嘈雜環境中電話通話的語音清晰度
SI-SDR提升11.94dB,STOI提升0.207
音頻後期處理
錄音去噪
從含環境噪聲的錄音中分離純淨語音
SIR提升22.46dB,SAR提升4.25dB
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase