C

Convtasnet Libri2Mix Sepclean 16k

JorisCosによって開発
これはAsteroidフレームワークを基に訓練されたConvTasNetモデルで、オーディオ分離タスクに特化しており、Libri2Mixデータセットのsep_cleanタスクで訓練されています。
ダウンロード数 13.38k
リリース時間 : 3/2/2022

モデル概要

このモデルは主に混合オーディオからクリーンな音声信号を分離するために使用され、音声強化やオーディオ処理のシーンに適しています。

モデル特徴

効率的なオーディオ分離
ConvTasNetアーキテクチャを使用して高品質の音声分離を実現
最適化された訓練設定
精心設計されたフィルタバンクとマスクネットワークの設定を採用し、分離効果を向上させる
良好な性能指標
Libri2Mixテストセットで優れた性能を発揮し、SI - SDRが15.24dBに達する

モデル能力

音声分離
オーディオ強化
多話者分離

使用事例

音声処理
会議録音分離
複数人の会議録音から個々の話者の音声を分離する
SI - SDRが15.24dB向上
音声強化
背景ノイズから明瞭な音声を抽出する
STOIが0.226向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase