S

Sepformer Whamr Enhancement

speechbrainによって開発
このモデルはSepFormerアーキテクチャを通じて音声強化(ノイズ除去 + 残響除去)を実現し、WHAMR!データセット(8kHz)で事前学習され、テストセットのSI - SNRは10.59dBに達します。
ダウンロード数 570
リリース時間 : 3/2/2022

モデル概要

Transformerベースの音声強化モデルで、環境ノイズと残響を含む音声信号の処理に特化し、ノイズ除去と残響除去を同時に行うことができます。

モデル特徴

双タスク処理
音声ノイズ除去と残響除去の2つのタスクを同時に処理できます
Transformerアーキテクチャ
SepFormerアーキテクチャを採用し、注意力機構を利用して効率的な音声分離を実現します
低サンプリング率最適化
8kHzサンプリング周波数の音声信号に特化して最適化されています

モデル能力

音声ノイズ除去
音声残響除去
音声品質強化

使用事例

音声処理
通話品質強化
騒がしい環境下での音声通話の明瞭度を向上させます
SI - SNRが10.59dB向上し、PESQが2.84に達します
会議録音強化
会議室など残響が激しいシーンの録音品質を改善します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase