DCUNet_Libri1Mix_enhsingle_16k開源音頻增強模型 - 免費部署助力單聲道語音增強

首頁

Dcunet Libri1Mix Enhsingle 16k

由JorisCos開發

基於Asteroid框架訓練的音頻增強模型，專門用於單聲道語音增強任務

音頻增強

PyTorch

#單聲道語音增強 #DCUNet架構 #高STOI提升

下載量 69

發布時間 : 3/2/2022

模型概述

該模型採用DCUNet-20架構，在Libri1Mix數據集上訓練，用於提升單聲道音頻質量，特別適用於語音增強場景

模型特點

高性能語音增強

在Libri1Mix測試集上實現了13.15dB的SI-SDR提升和0.92的STOI評分

深度複數U-Net架構

採用20層DCUNet結構，專門設計用於處理複數頻譜的音頻信號

固定長度處理

支持填充模式的固定長度音頻處理，適合批量處理

模型能力

單聲道語音增強

音頻質量提升

噪聲抑制

使用案例

語音處理

通話質量增強

提升語音通話中的語音清晰度和可懂度

SI-SDR提升9.7dB，STOI提升12.4%

語音識別預處理

作為ASR系統的前端處理模塊，提高識別準確率

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Dcunet Libri1Mix Enhsingle 16k

模型概述

模型特點

模型能力

使用案例

🚀 Asteroid模型 `JorisCos/DCUNet_Libri1Mix_enhsignle_16k`

🚀 快速開始

📚 詳細文檔

訓練配置

模型效果

📄 許可證

Dcunet Libri1Mix Enhsingle 16k

模型概述

模型特點

模型能力

使用案例

🚀 Asteroid模型 JorisCos/DCUNet_Libri1Mix_enhsignle_16k

🚀 快速開始

📚 詳細文檔

訓練配置

模型效果

📄 許可證

🚀 Asteroid模型 `JorisCos/DCUNet_Libri1Mix_enhsignle_16k`