T

TIGER DnR

JusperLeeによって開発
TIGERは軽量音声分離モデルで、周波数帯域分割とマルチスケール特徴抽出により効率的な音声処理を実現
ダウンロード数 134
リリース時間 : 1/22/2025

モデル概要

TIGERは効率的な音声分離モデルで、周波数帯域分割とインターリーブ構造を採用し、高性能を維持しながら計算コストを大幅に削減。主に音声分離、ノイズ除去、残響除去タスクに使用。

モデル特徴

効率的周波数帯域分割
事前知識による周波数帯域分割と周波数情報圧縮で計算コストを大幅削減
マルチスケール特徴抽出
マルチスケール選択的注意(MSA)モジュールで文脈特徴を効果的に抽出
軽量設計
パラメータ数94.3%削減、MACs95.3%削減しながら高性能を維持
実環境適応
複雑ノイズと残響を含むEchoSetデータセットで優れた性能

モデル能力

音声分離
背景ノイズ除去
残響除去
複数話者音声分離

使用事例

音声強調
会議録音強化
複数人が同時に話す録音から明確な単一話者音声を分離
EchoSetデータセットでTF-GridNetモデルを上回る性能
騒音環境音声処理
背景ノイズと残響を除去し音声明瞭度を向上
物体遮蔽や材料特性影響を含む実残響を効果的に処理
音響ポストプロダクション
映像音声修復
現場録音から対象音声を分離・強調
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase