A

Audio Source Separation

由Awais開發
基於Asteroid框架訓練的音頻源分離模型,專為8kHz採樣率的語音分離任務優化
下載量 30
發布時間 : 4/2/2022

模型概述

該模型使用ConvTasNet架構,針對Libri2Mix數據集的乾淨語音分離任務進行訓練,能夠將混合音頻中的不同說話人聲音分離

模型特點

高效分離
採用ConvTasNet架構,在8kHz採樣率下實現高效語音分離
優化訓練
基於Libri2Mix數據集進行專門優化,適合乾淨語音分離場景
輕量級
模型參數規模適中,適合實際部署應用

模型能力

雙說話人語音分離
8kHz音頻處理
即時音頻源分離

使用案例

語音處理
會議記錄增強
分離會議錄音中的不同說話人聲音
SI-SDR提升14.76dB
語音識別預處理
為ASR系統提供更乾淨的單一說話人音頻輸入
STOI提升0.93
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase