D

Dprnntasnet Ks16 WHAM Sepclean

julien-cによって開発
これはAsteroidフレームワークでトレーニングされた音源分離モデルで、混合音声からクリーンな音声信号を分離するために特別に設計されています。
ダウンロード数 66
リリース時間 : 3/2/2022

モデル概要

このモデルはDPRNNTasNetアーキテクチャを使用し、WHAM!データセットのsep_cleanタスクでトレーニングされており、混合音声から音声信号を効果的に分離できます。

モデル特徴

効率的な音源分離
DPRNNアーキテクチャを採用し、混合音声からクリーンな音声信号を効率的に分離できます。
小さなカーネルサイズ
小さなカーネルサイズ(16)を使用しており、より細かい音声特徴を捉えるのに役立ちます。
高い分離品質
WHAM!データセットで優れた性能を発揮し、SI-SDRの改善は18.23 dBに達します。

モデル能力

音源分離
音声信号抽出
混合音声処理

使用事例

音声処理
音声強調
騒がしい環境からクリアな音声信号を抽出
SI-SDR改善18.23 dB
会議記録
複数人が同時に話している音声信号を分離
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase