Convtasnet WHAM Sepclean
這是一個基於Asteroid框架訓練的ConvTasNet模型,專門用於音頻分離任務,在WHAM!數據集的sep_clean任務上進行訓練。
下載量 302
發布時間 : 3/2/2022
模型概述
該模型主要用於音頻到音頻的分離任務,能夠將混合音頻中的不同源分離出來,特別適用於語音分離場景。
模型特點
高效的音頻分離
採用ConvTasNet架構,能夠高效地從混合音頻中分離出不同源
高質量分離效果
在WHAM!數據集上表現出色,SI-SDR指標達到16.21dB
輕量級設計
模型參數經過優化,適合實際應用部署
模型能力
音頻分離
語音增強
多源音頻處理
使用案例
語音處理
會議錄音分離
將多人會議的混合錄音分離為單個說話人的獨立音頻
SI-SDR提升16.21dB,語音清晰度(STOI)達到0.96
音頻後期製作
從背景音樂和音效中分離出人聲部分
SIR指標達到26.86dB,表明良好的源分離能力
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98