S

Sepformer Rescuespeech

由speechbrain開發
這是一個基於SepFormer架構的語音增強模型,專門針對救援場景中的德語語音進行去噪處理,在16kHz採樣率下表現優異。
下載量 62
發布時間 : 6/30/2023

模型概述

該模型使用SepFormer架構實現語音增強功能,先在Microsoft-DNS 4數據集上預訓練,後在救援語音數據集上微調,能有效提升嘈雜環境中的語音質量。

模型特點

救援場景優化
專門針對救援場景中的語音數據進行微調,提升在嘈雜環境中的語音增強效果
高性能架構
採用SepFormer架構,結合Transformer的優勢,實現高效的語音分離
多指標優化
在SI-SNR、SI-SDR和PESQ等多個語音質量評估指標上均有顯著提升

模型能力

語音去噪
語音增強
救援場景語音處理

使用案例

緊急救援
救援通信增強
在嘈雜的救援環境中提升語音通信質量
PESQ評分提升至2.24,SI-SNR提升7.849dB
語音處理
語音質量改善
對低質量語音進行增強處理
SI-SDR提升8.414dB
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase