ConvTasNet_Libri3Mix_sepnoisy_16k開源模型 - 免費分離混合音頻中的噪聲與語音信號

首頁

Convtasnet Libri3Mix Sepnoisy 16k

由JorisCos開發

基於Asteroid框架訓練的ConvTasNet模型，用於從混合音頻中分離噪聲和語音信號。

聲音分離

PyTorch

#多說話人分離 #噪聲抑制 #16kHz音頻處理

下載量 473

發布時間 : 3/2/2022

模型概述

該模型使用Libri3Mix數據集在分離噪聲任務上進行訓練，能夠從包含多個說話者和背景噪聲的混合音頻中分離出清晰的語音信號。

模型特點

高效的音頻分離

使用ConvTasNet架構，能夠高效地從混合音頻中分離出多個說話者的語音信號。

噪聲抑制

專門針對包含背景噪聲的混合音頻進行訓練，能夠有效抑制噪聲。

高採樣率支持

支持16kHz的音頻採樣率，適用於高質量的音頻處理需求。

模型能力

音頻分離

噪聲抑制

多說話者分離

使用案例

語音增強

會議錄音增強

從包含多個說話者和背景噪聲的會議錄音中分離出清晰的語音信號。

SI-SDR改進10.28dB，SIR改進18.57dB

音頻後期處理

影視音頻處理

從影視錄音中分離出清晰的對話信號，去除背景噪聲。

STOI改進0.207，語音清晰度顯著提升

屬性	詳情
標籤	asteroid、audio、ConvTasNet、audio - to - audio
數據集	Libri3Mix、sep_noisy
許可證	cc - by - sa - 4.0

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Convtasnet Libri3Mix Sepnoisy 16k

模型概述

模型特點

模型能力

使用案例

🚀 Asteroid模型 `JorisCos/ConvTasNet_Libri3Mix_sepnoisy_16k`

🚀 快速開始

🔧 技術細節

訓練配置

訓練結果

📄 許可證

Convtasnet Libri3Mix Sepnoisy 16k

模型概述

模型特點

模型能力

使用案例

🚀 Asteroid模型 JorisCos/ConvTasNet_Libri3Mix_sepnoisy_16k

🚀 快速開始

🔧 技術細節

訓練配置

訓練結果

📄 許可證

🚀 Asteroid模型 `JorisCos/ConvTasNet_Libri3Mix_sepnoisy_16k`