S

Sepformer Whamr Enhancement

Developed by speechbrain
このモデルはSepFormerアーキテクチャを通じて音声強化(ノイズ除去 + 残響除去)を実現し、WHAMR!データセット(8kHz)で事前学習され、テストセットのSI - SNRは10.59dBに達します。
Downloads 570
Release Time : 3/2/2022

Model Overview

Transformerベースの音声強化モデルで、環境ノイズと残響を含む音声信号の処理に特化し、ノイズ除去と残響除去を同時に行うことができます。

Model Features

双タスク処理
音声ノイズ除去と残響除去の2つのタスクを同時に処理できます
Transformerアーキテクチャ
SepFormerアーキテクチャを採用し、注意力機構を利用して効率的な音声分離を実現します
低サンプリング率最適化
8kHzサンプリング周波数の音声信号に特化して最適化されています

Model Capabilities

音声ノイズ除去
音声残響除去
音声品質強化

Use Cases

音声処理
通話品質強化
騒がしい環境下での音声通話の明瞭度を向上させます
SI - SNRが10.59dB向上し、PESQが2.84に達します
会議録音強化
会議室など残響が激しいシーンの録音品質を改善します
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase