C

Convtasnet Libri2Mix Sepclean 8k

由JorisCos開發
基於Asteroid框架訓練的ConvTasNet模型,用於8kHz採樣率的語音分離任務,在Libri2Mix數據集上訓練。
下載量 179
發布時間 : 3/2/2022

模型概述

該模型用於從混合音頻中分離出乾淨的語音信號,特別適用於雙說話人場景。

模型特點

高效的語音分離
能夠在8kHz採樣率下有效分離混合語音中的說話人
優化的ConvTasNet架構
使用8個塊和3次重複的深度網絡結構,具有128個跳躍連接通道
輕量級訓練
使用24的批次大小和3秒的音頻片段長度進行高效訓練

模型能力

雙說話人語音分離
音頻信號增強
語音信號處理

使用案例

語音處理
會議記錄分離
從多人會議錄音中分離出單個說話人的語音
SI-SDR提升14.76dB
語音增強
從背景噪聲或其他說話人中提取目標語音
STOI提升0.218
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase