C

Convtasnet Libri3Mix Sepnoisy

由mpariente開發
基於Asteroid框架訓練的ConvTasNet模型,用於含噪音頻分離任務,訓練數據來自Libri3Mix數據集。
下載量 30
發布時間 : 3/2/2022

模型概述

該模型專為含噪環境下的多說話人語音分離任務設計,能夠從混合音頻中分離出清晰的單說話人語音。

模型特點

高效的音頻分離
採用ConvTasNet架構,能夠有效處理含噪環境下的多說話人語音分離任務。
優化的訓練配置
使用精心設計的濾波器組和掩碼網絡配置,提升分離性能。
全面的性能指標
提供SI-SDR、SDR、SIR、SAR和STOI等多種評估指標,全面衡量模型性能。

模型能力

多說話人語音分離
含噪音頻處理
音頻增強

使用案例

語音處理
會議記錄增強
從多人會議錄音中分離出清晰的單人語音,提升語音識別準確率。
SI-SDR提升11.23,STOI提升0.22
語音通信降噪
在嘈雜環境中分離出目標說話人語音,提高通信質量。
SIR提升19.53
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase