S

Sepformer Libri3mix

由speechbrain開發
這是一個基於SepFormer架構的音頻源分離模型,在Libri3Mix數據集上訓練,能夠將混合語音分離為多個獨立音源。
下載量 1,511
發布時間 : 9/16/2022

模型概述

該模型使用SepFormer架構實現音頻源分離功能,專門針對混合語音場景設計,能夠從混合音頻中分離出獨立的語音源。

模型特點

高性能分離能力
在Libri3Mix測試集上達到19.8 dB SI-SNRi的分離性能
基於Transformer架構
採用先進的SepFormer架構,利用自注意力機制實現高效分離
多說話人分離
能夠同時分離混合音頻中的多個說話人聲音

模型能力

音頻源分離
多說話人語音分離
8kHz音頻處理

使用案例

語音處理
會議錄音分離
將多人會議錄音分離為獨立的說話人音頻
可清晰分離3個同時說話的語音源
語音增強
從背景噪音中提取清晰語音
提高語音識別準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase