C

Convtasnet Libri2Mix Sepnoisy 8k

JorisCosによって開発
Asteroidフレームワークを基に訓練されたConvTasNetモデルで、8kHzサンプリングレートの音声分離タスクに使用され、特にノイズを含む混合音声シーンに対応しています。
ダウンロード数 31
リリース時間 : 3/2/2022

モデル概要

このモデルはConvTasNetアーキテクチャを採用し、Libri2Mixデータセットの「sep_noisy」タスクで訓練され、ノイズを含む混合オーディオから明瞭な音声信号を分離することができます。

モデル特徴

ノイズロバスト性
ノイズを含む混合音声に特化して最適化されており、背景ノイズと音声信号を効果的に分離できます。
軽量アーキテクチャ
ConvTasNetアーキテクチャを採用し、高い分離性能を維持しながら低い計算複雑度を持ちます。
8kHz最適化
8kHzサンプリングレートのオーディオに特化して最適化されており、電話音声などの低帯域シーンに適しています。

モデル能力

音声分離
ノイズ抑制
オーディオ強化

使用事例

音声通信
電話音声強化
騒がしい環境での電話通話の音声の明瞭度を向上させます。
SI - SDRが11.94dB向上、STOIが0.207向上
オーディオ後処理
録音ノイズ除去
環境ノイズを含む録音から純粋な音声を分離します。
SIRが22.46dB向上、SARが4.25dB向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase