S

Sepformer Wsj03mix

由speechbrain開發
這是一個使用SepFormer架構進行音頻源分離的模型,在WSJ0-3Mix數據集上訓練,能夠將混合語音分離成獨立的語音源。
下載量 158
發布時間 : 3/2/2022

模型概述

該模型基於Transformer架構的SepFormer實現,專門用於音頻源分離任務,能夠從混合音頻中分離出多個獨立的語音信號。

模型特點

高性能分離
在WSJ0-3Mix測試集上達到19.8 dB SI-SNRi和20.0 dB SDRi的分離性能
基於Transformer架構
採用先進的SepFormer架構,利用注意力機制實現高效語音分離
即用型模型
提供簡單易用的接口,可直接對音頻文件進行分離處理

模型能力

語音分離
多說話人分離
音頻源分離

使用案例

語音處理
會議錄音分離
從多人同時說話的會議錄音中分離出各個說話人的獨立語音
可清晰分離3個同時說話的語音源
音頻增強
從嘈雜的混合音頻中提取目標語音信號
提高語音清晰度和可懂度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase