D

Dcunet Libri1Mix Enhsingle 16k

JorisCosによって開発
Asteroidフレームワークを基に訓練されたオーディオ強化モデルで、モノラル音声強化タスクに特化しています。
ダウンロード数 69
リリース時間 : 3/2/2022

モデル概要

このモデルはDCUNet - 20アーキテクチャを採用し、Libri1Mixデータセットで訓練され、モノラルオーディオの品質向上に使用され、特に音声強化シーンに適しています。

モデル特徴

高性能音声強化
Libri1Mixテストセットで13.15dBのSI - SDR向上と0.92のSTOIスコアを達成しました。
深度複素U - Netアーキテクチャ
20層のDCUNet構造を採用し、複素スペクトルのオーディオ信号を処理するために特別に設計されています。
固定長処理
パディングモードの固定長オーディオ処理をサポートし、バッチ処理に適しています。

モデル能力

モノラル音声強化
オーディオ品質向上
ノイズ抑制

使用事例

音声処理
通話品質強化
音声通話の音声の明瞭度と理解度を向上させます。
SI - SDRが9.7dB向上、STOIが12.4%向上
音声認識前処理
ASRシステムの前端処理モジュールとして、認識精度を向上させます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase