O

Overlapped Speech Detection

由pyannote開發
一個用於檢測音頻中重疊語音的預訓練模型,能夠識別兩個或更多說話人同時活躍的時間段。
下載量 144.68k
發布時間 : 3/2/2022

模型概述

該模型主要用於檢測音頻中的重疊語音部分,即兩個或更多說話人同時說話的片段。適用於語音處理、說話人日誌等任務。

模型特點

重疊語音檢測
準確識別音頻中兩個或更多說話人同時活躍的時間段
端到端訓練
採用端到端的訓練方式,直接從原始音頻學習特徵
預訓練模型
提供開箱即用的預訓練模型,無需從頭訓練

模型能力

重疊語音檢測
說話人分割
音頻時間線分析

使用案例

語音處理
會議記錄分析
分析會議錄音中的重疊對話部分,提高轉錄準確性
可識別多人同時發言的片段
說話人日誌
為說話人日誌系統提供重疊語音檢測功能
改善說話人分割的準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase