D

Dcunet Libri1Mix Enhsingle 16k

由JorisCos開發
基於Asteroid框架訓練的音頻增強模型,專門用於單聲道語音增強任務
下載量 69
發布時間 : 3/2/2022

模型概述

該模型採用DCUNet-20架構,在Libri1Mix數據集上訓練,用於提升單聲道音頻質量,特別適用於語音增強場景

模型特點

高性能語音增強
在Libri1Mix測試集上實現了13.15dB的SI-SDR提升和0.92的STOI評分
深度複數U-Net架構
採用20層DCUNet結構,專門設計用於處理複數頻譜的音頻信號
固定長度處理
支持填充模式的固定長度音頻處理,適合批量處理

模型能力

單聲道語音增強
音頻質量提升
噪聲抑制

使用案例

語音處理
通話質量增強
提升語音通話中的語音清晰度和可懂度
SI-SDR提升9.7dB,STOI提升12.4%
語音識別預處理
作為ASR系統的前端處理模塊,提高識別準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase