C

Convtasnet Libri1Mix Enhsingle

由mhu-coder開發
基於Asteroid框架訓練的ConvTasNet模型,用於單通道語音增強任務
下載量 18
發布時間 : 3/2/2022

模型概述

該模型採用ConvTasNet架構,在Libri1Mix數據集的enh_single任務上進行訓練,主要用於單通道語音增強,能夠從混合音頻中分離出目標語音信號。

模型特點

高效語音分離
採用ConvTasNet架構,能夠有效分離混合音頻中的目標語音信號
優化的訓練配置
使用Adam優化器,學習率0.001,訓練200個週期,實現最佳性能
高質量結果
在Libri1Mix數據集上取得了SI-SDR 13.94和STOI 0.92的優異表現

模型能力

單通道語音增強
音頻信號分離
語音質量提升

使用案例

語音處理
語音通信增強
在嘈雜環境中提升語音通信質量
SI-SDR提升10.49dB,語音可懂度(STOI)提升0.12
會議記錄增強
從多人會議錄音中分離特定發言人的語音
SDR提升11.06dB
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase