S

Sepformer Rescuespeech

speechbrainによって開発
これはSepFormerアーキテクチャに基づく音声強化モデルで、救援シーンのドイツ語音声に対してノイズ除去処理を行い、16kHzのサンプリングレートで優れた性能を発揮します。
ダウンロード数 62
リリース時間 : 6/30/2023

モデル概要

このモデルはSepFormerアーキテクチャを使用して音声強化機能を実現し、まずMicrosoft-DNS 4データセットで事前学習を行い、その後救援音声データセットで微調整を行い、雑音の多い環境での音声品質を効果的に向上させることができます。

モデル特徴

救助シーンの最適化
救助シーンの音声データに特化して微調整を行い、雑音の多い環境での音声強化効果を向上させます
高性能アーキテクチャ
SepFormerアーキテクチャを採用し、Transformerの利点を生かして効率的な音声分離を実現します
多指標最適化
SI-SNR、SI-SDR、PESQなどの複数の音声品質評価指標で顕著な向上が見られます

モデル能力

音声ノイズ除去
音声強化
救助シーンの音声処理

使用事例

緊急救助
救援通信の強化
雑音の多い救援環境で音声通信品質を向上させます
PESQスコアが2.24に向上し、SI-SNRが7.849dB向上します
音声処理
音声品質の改善
低品質の音声に対して強化処理を行います
SI-SDRが8.414dB向上します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase