S

Sepformer Dns4 16k Enhancement

speechbrainによって開発
これはSepFormerアーキテクチャに基づく音声エンハンスメントモデルで、ノイズ除去タスクに特化しており、マイクロソフトDNS - 4データセットで訓練され、16kHzサンプリング周波数のオーディオ処理をサポートします。
ダウンロード数 1,669
リリース時間 : 8/6/2023

モデル概要

このモデルはSepFormerアーキテクチャを使用して音声エンハンスメント機能を実現し、主にオーディオの背景ノイズを除去し、音声品質を向上させます。モデルは1300時間のマイクロソフトDNS 4データセットで訓練され、16kHzサンプリング周波数のオーディオに適しています。

モデル特徴

高性能ノイズ除去
DNS4 2022ベースライン開発セットで優れた性能を発揮し、DNSMOS SIGスコアは2.999、BAKスコアは3.076、OVRLスコアは2.437です。
多言語対応
英語、ドイツ語、ロシア語、フランス語、イタリア語、スペイン語を含む複数の言語をサポートします。
Transformerアーキテクチャベース
先進的なSepFormerアーキテクチャを採用し、Transformerの利点を組み合わせて音声分離とエンハンスメントを行います。

モデル能力

オーディオノイズ除去
音声品質エンハンスメント
背景ノイズ抑制

使用事例

音声通信
VoIP通話エンハンスメント
ネットワーク音声通話の品質を向上させ、背景ノイズの干渉を減らします。
通話の明瞭度を大幅に改善します。
オーディオ後期処理
録音ノイズ除去
現場録音のノイズ除去処理を行い、音声の理解度を向上させます。
録音品質を向上させ、音声をより明瞭にします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase