M

Mtl Mimic Voicebank

speechbrainによって開発
SpeechBrainベースの音声強調とロバストASRトレーニングシステム、模倣損失トレーニング戦略を採用
ダウンロード数 11.11k
リリース時間 : 3/2/2022

モデル概要

このモデルは3段階のトレーニングプロセスで音声強調と自動音声認識(ASR)を実現し、16kHz単一チャンネル音声処理をサポート、事前トレーニング知覚モデル、強調モデルトレーニング、ASR微調整モジュールを含む

モデル特徴

模倣損失トレーニング
3段階トレーニング戦略を採用し、事前トレーニング知覚モデルを通じて強調モデルの学習を誘導
共同最適化
強調モデルとASRモデルは独立または共同で使用可能、システムの柔軟性を向上
標準化処理
16kHz単一チャンネル音声を自動処理、リサンプリングとモノラル変換をサポート

モデル能力

音声強調
ノイズ抑制
ロバスト音声認識
音響特徴抽出

使用事例

音声通信
騒音環境下での音声強調
背景雑音環境で音声明瞭度を向上
PESQ 3.05 / COVL 3.74(テストセット)
音声認識
ノイズ環境ASR
ノイズ環境下での音声認識精度向上
WER 2.80(テストセット)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase