C

Convtasnet Libri3Mix Sepnoisy 8k

由JorisCos開發
基於Asteroid框架訓練的ConvTasNet模型,用於從混合音頻中分離出3個獨立音源,特別針對8kHz採樣率的含噪聲語音數據優化。
下載量 33
發布時間 : 3/2/2022

模型概述

該模型採用ConvTasNet架構,專門設計用於音頻源分離任務,能夠從混合音頻中分離出3個獨立的語音源,尤其適用於含噪聲環境下的語音分離。

模型特點

多源語音分離
能夠同時分離混合音頻中的3個獨立語音源
噪聲魯棒性
專門針對含噪聲環境下的語音分離進行優化
輕量級架構
採用高效的ConvTasNet架構,適合即時處理

模型能力

音頻源分離
噪聲抑制
多說話人分離

使用案例

語音處理
會議記錄增強
從多人同時說話的錄音中分離出單個說話人的清晰語音
可提升語音識別準確率
音頻後期製作
從混合音軌中提取特定說話人的聲音
便於重新混音或編輯
輔助技術
助聽設備
在嘈雜環境中分離目標說話人語音
改善聽力障礙用戶的聽覺體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase