T

TIGER DnR

由JusperLee開發
TIGER是一款輕量級語音分離模型,通過頻帶分割和多尺度特徵提取實現高效音頻處理
下載量 134
發布時間 : 1/22/2025

模型概述

TIGER是一種高效的語音分離模型,採用頻帶分割和交錯建模結構,在保持高性能的同時大幅降低計算成本。主要用於語音分離、降噪和混響消除任務。

模型特點

高效頻帶分割
通過先驗知識劃分頻帶並對頻率信息進行壓縮,顯著降低計算成本
多尺度特徵提取
採用多尺度選擇性注意力(MSA)模塊有效提取上下文特徵
輕量級設計
參數數量減少94.3%,MACs降低95.3%,同時保持高性能
真實場景適應
在包含複雜噪聲和混響的EchoSet數據集上表現優異

模型能力

語音分離
背景噪聲消除
混響消除
多說話人語音分離

使用案例

語音增強
會議錄音增強
從多人同時說話的錄音中分離出清晰的單人語音
在EchoSet數據集上優於TF-GridNet模型
嘈雜環境語音處理
消除背景噪聲和混響,提高語音清晰度
有效處理包含物體遮擋和材料特性影響的真實混響
音頻後期製作
影視音頻修復
從現場錄音中分離和增強目標語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase