C

Convtasnet Libri3Mix Sepnoisy 8k

JorisCosによって開発
AsteroidフレームワークでトレーニングされたConvTasNetモデルで、混合音声から3つの独立した音源を分離するために設計されており、特に8kHzサンプリングレートのノイズを含む音声データに最適化されています。
ダウンロード数 33
リリース時間 : 3/2/2022

モデル概要

このモデルはConvTasNetアーキテクチャを採用しており、音声源分離タスクに特化して設計されており、混合音声から3つの独立した音声源を分離することができ、特にノイズ環境下での音声分離に適しています。

モデル特徴

マルチソース音声分離
混合音声から3つの独立した音声源を同時に分離可能
ノイズ耐性
ノイズ環境下での音声分離に特化して最適化
軽量アーキテクチャ
効率的なConvTasNetアーキテクチャを採用し、リアルタイム処理に適している

モデル能力

音声源分離
ノイズ抑制
マルチスピーカー分離

使用事例

音声処理
会議録音の強化
複数人が同時に話している録音から個々の話者のクリアな音声を分離
音声認識精度の向上が可能
音声ポストプロダクション
混合音声トラックから特定の話者の声を抽出
リミックスや編集が容易になる
支援技術
補聴機器
騒がしい環境でターゲット話者の音声を分離
聴覚障害ユーザーの聴覚体験を改善
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase