P

Pyannote Speaker Diarization Endpoint

philschmidによって開発
pyannote.audio 2.0ベースの話者分割モデルで、音声中の話者変化や音声活動を自動検出
ダウンロード数 51
リリース時間 : 10/7/2022

モデル概要

このモデルはエンドツーエンドの話者分割システムで、音声中の話者変化、音声活動、オーバーラップ音声を自動検出し、手動介入なしで話者分割タスクを完了できます。

モデル特徴

完全自動処理
手動の音声活動検出や話者数の指定なしで分割可能
オーバーラップ音声検出
話者のオーバーラップ状況を検出・処理可能
話者数自動適応
話者数を自動決定可能、手動指定もサポート
高性能
複数のベンチマークデータセットで優れた性能を発揮

モデル能力

話者分割
音声活動検出
オーバーラップ音声検出
話者変化検出
自動話者カウント

使用事例

会議記録
会議記録分割
会議録音中の異なる発言者を自動分割
AMIデータセットで18.21%のDERを達成
電話録音分析
コールセンター通話分析
オペレーターと顧客の音声セグメントを自動識別
CALLHOMEデータセットで30.24%のDERを達成
メディアコンテンツ分析
インタビュー番組分析
インタビュー番組の司会者とゲストを自動識別
VoxConverseデータセットで12.76%のDERを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase