S

Sepformer Wham Enhancement

speechbrainによって開発
SepFormerモデルを使用して音声強化(ノイズ除去)を行うツールセットで、WHAM!データセット(8kHzサンプリング周波数版)で事前学習され、環境雑音と残響を除去します。
ダウンロード数 827
リリース時間 : 3/2/2022

モデル概要

このモデルはSepFormerアーキテクチャに基づいており、音声強化タスクに特化しており、オーディオ内の環境雑音と残響効果を効果的に除去し、音声の明瞭度を向上させます。

モデル特徴

効率的な音声ノイズ除去
オーディオ内の環境雑音と残響を効果的に除去し、音声の明瞭度を向上させます。
Transformerベースのアーキテクチャ
SepFormerアーキテクチャを採用し、自己注意機構を利用して効率的な音声分離と強化を実現します。
事前学習済みモデル
WHAM!データセットで事前学習されており、追加の学習なしで音声強化タスクに直接使用できます。

モデル能力

音声ノイズ除去
音声強化
オーディオ処理

使用事例

音声処理
音声強化
録音内の環境雑音と残響を除去し、音声の明瞭度を向上させます。
SI - SNRが14.35 dBに向上し、PESQが3.07に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase