多說話人分離

# 多說話人分離

Diar Sortformer 4spk V1

基於Sortformer架構的端到端說話人日誌模型，通過按說話人語音段到達時間順序解決日誌中的排列問題，支持最多4個說話人識別。

說話人處理

Wsj0 2mix Skim Small Causal

這是一個基於ESPnet框架訓練的語音增強模型，專門用於處理wsj0_2mix數據集中的混合語音信號分離任務。

音頻增強英語

Sepformer Libri3mix

這是一個基於SepFormer架構的音頻源分離模型，在Libri3Mix數據集上訓練，能夠將混合語音分離為多個獨立音源。

聲音分離英語

Sepformer Libri2mix

使用SepFormer架構實現的音頻源分離模型，在Libri2Mix數據集上訓練，可分離混合音頻中的獨立聲源

聲音分離英語

Sepformer Whamr

SepFormer是一種基於Transformer的音頻源分離模型，在WHAMR!數據集上訓練，用於分離混合語音信號。

聲音分離英語

Sepformer Wsj03mix

這是一個使用SepFormer架構進行音頻源分離的模型，在WSJ0-3Mix數據集上訓練，能夠將混合語音分離成獨立的語音源。

聲音分離英語

Sepformer Wsj02mix

基於SepFormer架構的音頻源分離模型，在WSJ0-2Mix數據集上訓練，能夠將混合音頻分離為獨立的語音源。

聲音分離英語

Convtasnet Libri3Mix Sepnoisy

基於Asteroid框架訓練的ConvTasNet模型，用於含噪音頻分離任務，訓練數據來自Libri3Mix數據集。

Convtasnet Libri3Mix Sepnoisy 8k

基於Asteroid框架訓練的ConvTasNet模型，用於從混合音頻中分離出3個獨立音源，特別針對8kHz採樣率的含噪聲語音數據優化。

Convtasnet Libri2Mix Sepnoisy 16k

基於Asteroid框架訓練的ConvTasNet模型，用於含噪語音分離任務，在Libri2Mix數據集上訓練。

Convtasnet Libri3Mix Sepnoisy 16k

基於Asteroid框架訓練的ConvTasNet模型，用於從混合音頻中分離噪聲和語音信號。

Convtasnet Libri3Mix Sepclean 16k

基於Asteroid框架訓練的ConvTasNet模型，用於語音分離任務，在Libri3Mix數據集上訓練，支持16kHz採樣率的音頻輸入。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase