2025年最佳的 17 个音频增强工具

Metricgan Plus Voicebank
Apache-2.0
这是一个使用MetricGAN+方法训练的语音增强模型,能够有效提升语音质量。
音频增强 英语
M
speechbrain
55.91k
65
Mtl Mimic Voicebank
Apache-2.0
基于SpeechBrain的语音增强与鲁棒性ASR训练系统,采用模仿损失训练策略
音频增强 英语
M
speechbrain
11.11k
35
Dccrnet Libri1Mix Enhsingle 16k
基于Asteroid框架训练的DCCRN-CL架构语音增强模型,专为单通道语音增强任务设计,在Libri1Mix数据集上训练。
音频增强
D
JorisCos
10.99k
16
Sepformer Wham16k Enhancement
Apache-2.0
这是一个使用SepFormer架构的语音增强模型,专门用于去除音频中的噪声和混响,在WHAM!数据集上以16kHz采样频率训练。
音频增强 英语
S
speechbrain
5,140
28
Dprnntasnet Ks2 Libri1Mix Enhsingle 16k
基于Asteroid框架训练的音频增强模型,专为单通道语音增强任务设计,在Libri1Mix数据集上训练。
音频增强
D
JorisCos
4,859
1
Dptnet Libri1Mix Enhsingle 16k
基于Asteroid框架训练的音频增强模型,专注于单声道语音增强任务
音频增强
D
JorisCos
4,446
3
Convtasnet Libri1Mix Enhsingle 16k
基于Asteroid框架训练的ConvTasNet模型,用于单通道语音增强任务,在Libri1Mix数据集上训练。
音频增强
C
JorisCos
2,570
3
Sepformer Dns4 16k Enhancement
Apache-2.0
这是一个基于SepFormer架构的语音增强模型,专门用于去噪任务,在微软DNS-4数据集上训练,支持16kHz采样频率的音频处理。
音频增强 支持多种语言
S
speechbrain
1,669
20
Sepformer Wham Enhancement
Apache-2.0
使用SepFormer模型进行语音增强(去噪)的工具集,在WHAM!数据集(8kHz采样频率版本)上预训练,实现环境噪声和混响的去除。
音频增强 英语
S
speechbrain
827
23
MP SENet DNS
MIT
一个基于Pytorch的音频去噪和语音增强模型,有效去除音频噪声提升语音清晰度
音频增强 Safetensors
M
JacobLinCool
723
1
Sepformer Whamr Enhancement
Apache-2.0
该模型通过SepFormer架构实现语音增强(去噪+去混响),在WHAMR!数据集(8kHz)上预训练,测试集SI-SNR达10.59dB。
音频增强 英语
S
speechbrain
570
11
Dcunet Libri1Mix Enhsingle 16k
基于Asteroid框架训练的音频增强模型,专门用于单声道语音增强任务
音频增强
D
JorisCos
69
5
Sepformer Rescuespeech
Apache-2.0
这是一个基于SepFormer架构的语音增强模型,专门针对救援场景中的德语语音进行去噪处理,在16kHz采样率下表现优异。
音频增强 德语
S
speechbrain
62
1
Wangyou Zhang Chime4 Enh Train Enh Conv Tasnet Raw
基于ESPnet框架训练的语音增强模型,使用chime4数据集进行训练,适用于单通道语音增强任务。
音频增强
W
espnet
57
1
Wsj0 2mix Skim Small Causal
这是一个基于ESPnet框架训练的语音增强模型,专门用于处理wsj0_2mix数据集中的混合语音信号分离任务。
音频增强 英语
W
lichenda
26
1
Voicerestore
MIT
基于流匹配变换器的语音录音质量修复系统,能显著提升受损录音质量
音频增强 Transformers
V
jadechoghari
24
41
Convtasnet Libri1Mix Enhsingle
基于Asteroid框架训练的ConvTasNet模型,用于单通道语音增强任务
音频增强
C
mhu-coder
18
1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase