M

Metricgan Plus Voicebank

speechbrainによって開発
これはMetricGAN+方法を使用して訓練された音声強化モデルで、音声品質を効果的に向上させることができます。
ダウンロード数 55.91k
リリース時間 : 3/2/2022

モデル概要

このモデルはSpeechBrainフレームワークに基づいて開発され、MetricGAN+方法を使用してVoicebankとDEMANDデータセットで訓練され、音声強化タスクに特化しており、音声の明瞭度と理解度を著しく向上させることができます。

モデル特徴

高品質の音声強化
このモデルは音声品質を著しく向上させることができ、テストセットでPESQが3.15、STOIが93.0に達します。
MetricGAN+に基づく訓練
改良されたMetricGAN+方法を使用して訓練され、音声品質評価指標をより良く最適化することができます。
使いやすい
簡単なAPIインターフェースを提供し、数行のコードで音声強化機能を実現できます。

モデル能力

音声強化
雑音抑制
音声品質の向上

使用事例

音声処理
音声通信品質の強化
雑音の多い環境で音声通話の明瞭度を向上させます
PESQが3.15に向上し、STOIが93.0に達します
音声認識の前処理
音声認識システムの前端処理モジュールとして使用します
後続の音声認識の正確率を向上させます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase