C

Convtasnet Libri3Mix Sepnoisy 16k

由JorisCos開發
基於Asteroid框架訓練的ConvTasNet模型,用於從混合音頻中分離噪聲和語音信號。
下載量 473
發布時間 : 3/2/2022

模型概述

該模型使用Libri3Mix數據集在分離噪聲任務上進行訓練,能夠從包含多個說話者和背景噪聲的混合音頻中分離出清晰的語音信號。

模型特點

高效的音頻分離
使用ConvTasNet架構,能夠高效地從混合音頻中分離出多個說話者的語音信號。
噪聲抑制
專門針對包含背景噪聲的混合音頻進行訓練,能夠有效抑制噪聲。
高採樣率支持
支持16kHz的音頻採樣率,適用於高質量的音頻處理需求。

模型能力

音頻分離
噪聲抑制
多說話者分離

使用案例

語音增強
會議錄音增強
從包含多個說話者和背景噪聲的會議錄音中分離出清晰的語音信號。
SI-SDR改進10.28dB,SIR改進18.57dB
音頻後期處理
影視音頻處理
從影視錄音中分離出清晰的對話信號,去除背景噪聲。
STOI改進0.207,語音清晰度顯著提升
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase