Dcunet Libri1Mix Enhsingle 16k
模型概述
該模型採用DCUNet-20架構,在Libri1Mix數據集上訓練,用於提升單聲道音頻質量,特別適用於語音增強場景
模型特點
高性能語音增強
在Libri1Mix測試集上實現了13.15dB的SI-SDR提升和0.92的STOI評分
深度複數U-Net架構
採用20層DCUNet結構,專門設計用於處理複數頻譜的音頻信號
固定長度處理
支持填充模式的固定長度音頻處理,適合批量處理
模型能力
單聲道語音增強
音頻質量提升
噪聲抑制
使用案例
語音處理
通話質量增強
提升語音通話中的語音清晰度和可懂度
SI-SDR提升9.7dB,STOI提升12.4%
語音識別預處理
作為ASR系統的前端處理模塊,提高識別準確率
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98