2025年最高の 17 個のオーディオ拡張ツール

Metricgan Plus Voicebank
Apache-2.0
これはMetricGAN+方法を使用して訓練された音声強化モデルで、音声品質を効果的に向上させることができます。
オーディオ拡張 英語
M
speechbrain
55.91k
65
Mtl Mimic Voicebank
Apache-2.0
SpeechBrainベースの音声強調とロバストASRトレーニングシステム、模倣損失トレーニング戦略を採用
オーディオ拡張 英語
M
speechbrain
11.11k
35
Dccrnet Libri1Mix Enhsingle 16k
Asteroidフレームワークを基に訓練されたDCCRN - CLアーキテクチャの音声強化モデルで、単チャンネル音声強化タスクに特化し、Libri1Mixデータセットで訓練されました。
オーディオ拡張
D
JorisCos
10.99k
16
Sepformer Wham16k Enhancement
Apache-2.0
これはSepFormerアーキテクチャを使用した音声エンハンスメントモデルで、音声のノイズと残響を除去するために特化しており、WHAM!データセットで16kHzのサンプリング周波数で訓練されています。
オーディオ拡張 英語
S
speechbrain
5,140
28
Dprnntasnet Ks2 Libri1Mix Enhsingle 16k
Asteroidフレームワークを基に訓練されたオーディオ強化モデルで、単チャンネル音声強化タスクに特化し、Libri1Mixデータセットで訓練されました。
オーディオ拡張
D
JorisCos
4,859
1
Dptnet Libri1Mix Enhsingle 16k
Asteroidフレームワークを基に訓練されたオーディオ強化モデルで、モノラル音声強化タスクに特化しています。
オーディオ拡張
D
JorisCos
4,446
3
Convtasnet Libri1Mix Enhsingle 16k
Asteroidフレームワークを基に訓練されたConvTasNetモデルで、単チャンネル音声強化タスクに使用され、Libri1Mixデータセットで訓練されています。
オーディオ拡張
C
JorisCos
2,570
3
Sepformer Dns4 16k Enhancement
Apache-2.0
これはSepFormerアーキテクチャに基づく音声エンハンスメントモデルで、ノイズ除去タスクに特化しており、マイクロソフトDNS - 4データセットで訓練され、16kHzサンプリング周波数のオーディオ処理をサポートします。
オーディオ拡張 複数言語対応
S
speechbrain
1,669
20
Sepformer Wham Enhancement
Apache-2.0
SepFormerモデルを使用して音声強化(ノイズ除去)を行うツールセットで、WHAM!データセット(8kHzサンプリング周波数版)で事前学習され、環境雑音と残響を除去します。
オーディオ拡張 英語
S
speechbrain
827
23
MP SENet DNS
MIT
Pytorchに基づくオーディオノイズ除去と音声強化モデルで、オーディオのノイズを効果的に除去し、音声の明瞭度を向上させます。
オーディオ拡張 Safetensors
M
JacobLinCool
723
1
Sepformer Whamr Enhancement
Apache-2.0
このモデルはSepFormerアーキテクチャを通じて音声強化(ノイズ除去 + 残響除去)を実現し、WHAMR!データセット(8kHz)で事前学習され、テストセットのSI - SNRは10.59dBに達します。
オーディオ拡張 英語
S
speechbrain
570
11
Dcunet Libri1Mix Enhsingle 16k
Asteroidフレームワークを基に訓練されたオーディオ強化モデルで、モノラル音声強化タスクに特化しています。
オーディオ拡張
D
JorisCos
69
5
Sepformer Rescuespeech
Apache-2.0
これはSepFormerアーキテクチャに基づく音声強化モデルで、救援シーンのドイツ語音声に対してノイズ除去処理を行い、16kHzのサンプリングレートで優れた性能を発揮します。
オーディオ拡張 ドイツ語
S
speechbrain
62
1
Wangyou Zhang Chime4 Enh Train Enh Conv Tasnet Raw
ESPnetフレームワークでトレーニングされた音声強調モデルで、chime4データセットを使用してトレーニングされ、シングルチャネル音声強調タスクに適しています。
オーディオ拡張
W
espnet
57
1
Wsj0 2mix Skim Small Causal
これはESPnetフレームワークで訓練された音声強調モデルで、wsj0_2mixデータセットの混合音声信号分離タスクに特化しています。
オーディオ拡張 英語
W
lichenda
26
1
Voicerestore
MIT
フローマッチングトランスフォーマーに基づく音声録音品質修復システムで、損傷した録音の品質を大幅に向上させます
オーディオ拡張 Transformers
V
jadechoghari
24
41
Convtasnet Libri1Mix Enhsingle
AsteroidフレームワークでトレーニングされたConvTasNetモデル、単一チャネル音声強調タスク用
オーディオ拡張
C
mhu-coder
18
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase