W

Wangyou Zhang Chime4 Enh Train Enh Conv Tasnet Raw

由espnet開發
基於ESPnet框架訓練的語音增強模型,使用chime4數據集進行訓練,適用於單通道語音增強任務。
下載量 57
發布時間 : 4/11/2022

模型概述

該模型採用Conv-TasNet架構,專門用於語音增強任務,能夠從含噪聲的混合語音中分離出清晰的語音信號。

模型特點

基於Conv-TasNet架構
採用時間卷積網絡(Temporal Convolutional Network)進行語音分離,具有高效的特徵提取能力。
端到端訓練
直接從原始音頻學習到目標語音的映射,無需複雜的特徵工程。
SI-SNR優化目標
使用尺度不變信噪比(SI-SNR)作為損失函數,優化語音質量。

模型能力

單通道語音增強
噪聲抑制
語音分離

使用案例

語音處理
會議語音增強
在嘈雜的會議環境中提取清晰的語音信號
提高語音識別準確率和可懂度
電話語音增強
改善移動通信中的語音質量
提升通話體驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase