C

Convtasnet Libri2Mix Sepnoisy 16k

由JorisCos開發
基於Asteroid框架訓練的ConvTasNet模型,用於含噪語音分離任務,在Libri2Mix數據集上訓練。
下載量 8,407
發布時間 : 3/2/2022

模型概述

該模型採用ConvTasNet架構,專門用於從含噪混合音頻中分離出清晰的語音信號,適用於語音增強和分離任務。

模型特點

高效語音分離
能夠在含噪環境下有效分離語音信號,提升語音清晰度。
優化的ConvTasNet架構
採用8個塊和3次重複的掩碼網絡結構,結合跳躍連接,優化分離效果。
高質量訓練數據
基於Libri2Mix和WSJ0 Hipster Ambient Mixtures數據集訓練,確保模型泛化能力。

模型能力

含噪語音分離
語音增強
多說話人分離

使用案例

語音處理
語音增強
在嘈雜環境中提取清晰語音信號,適用於語音識別預處理。
SI-SDR提升12.55dB,STOI提升0.224
會議記錄
分離會議錄音中的不同說話人語音,提高轉錄準確性。
SIR提升24.37dB
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase