S

Sepformer Wham16k Enhancement

Developed by speechbrain
これはSepFormerアーキテクチャを使用した音声エンハンスメントモデルで、音声のノイズと残響を除去するために特化しており、WHAM!データセットで16kHzのサンプリング周波数で訓練されています。
Downloads 5,140
Release Time : 6/30/2022

Model Overview

このモデルはTransformerアーキテクチャのSepFormerをベースに実装されており、主に音声エンハンスメントタスクに使用され、音声の環境ノイズと残響効果を効果的に除去することができます。

Model Features

効率的なノイズ除去
音声の環境ノイズと残響効果を効果的に除去することができます。
Transformerアーキテクチャベース
先進的なSepFormerアーキテクチャを採用し、自己注意機構を組み合わせて音声分離を行います。
16kHzの高サンプリングレート
16kHzのサンプリング周波数の音声処理をサポートし、より高品質の音声エンハンスメント効果を提供します。

Model Capabilities

音声ノイズ除去
音声エンハンスメント
残響除去

Use Cases

音声処理
音声エンハンスメント
環境ノイズのある音声の明瞭度を向上させます。
SI - SNRが14.3dBに向上し、PESQが2.20に達します。
会議録音処理
会議録音の背景ノイズと部屋の残響を除去します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase