TIGER DnR
TIGER是一款輕量級語音分離模型,通過頻帶分割和多尺度特徵提取實現高效音頻處理
下載量 134
發布時間 : 1/22/2025
模型概述
TIGER是一種高效的語音分離模型,採用頻帶分割和交錯建模結構,在保持高性能的同時大幅降低計算成本。主要用於語音分離、降噪和混響消除任務。
模型特點
高效頻帶分割
通過先驗知識劃分頻帶並對頻率信息進行壓縮,顯著降低計算成本
多尺度特徵提取
採用多尺度選擇性注意力(MSA)模塊有效提取上下文特徵
輕量級設計
參數數量減少94.3%,MACs降低95.3%,同時保持高性能
真實場景適應
在包含複雜噪聲和混響的EchoSet數據集上表現優異
模型能力
語音分離
背景噪聲消除
混響消除
多說話人語音分離
使用案例
語音增強
會議錄音增強
從多人同時說話的錄音中分離出清晰的單人語音
在EchoSet數據集上優於TF-GridNet模型
嘈雜環境語音處理
消除背景噪聲和混響,提高語音清晰度
有效處理包含物體遮擋和材料特性影響的真實混響
音頻後期製作
影視音頻修復
從現場錄音中分離和增強目標語音
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98