S

Speaker Diarization 3.0

pyannoteによって開発
pyannote.audio 3.0.0でトレーニングされたスピーカーダイアリゼーションパイプライン。自動音声活動検出、スピーカー変化検出、オーバーラップ音声検出をサポート
ダウンロード数 463.91k
リリース時間 : 9/22/2023

モデル概要

このモデルは音声中のスピーカーダイアリゼーションタスクに使用され、音声中の異なるスピーカーとその活動時間帯を自動的に識別できます。16kHzサンプリングのモノラル音声処理をサポートします。

モデル特徴

自動音声活動検出
手動の音声活動検出が不要で、モデルが自動的に音声活動を識別
スピーカー数の自動推論
音声中のスピーカー数を自動的に推論可能。手動指定もサポート
オーバーラップ音声処理
スピーカーが重複する音声セグメントを検出・処理可能
複数データセットでのトレーニング
AISHELL、AliMeeting、AMIなどの複数データセットでトレーニングされており、幅広い適用性を有する

モデル能力

スピーカーダイアリゼーション
音声活動検出
スピーカー変化検出
オーバーラップ音声検出
自動スピーカーカウント

使用事例

会議記録
会議記録のスピーカーダイアリゼーション
会議録音中の異なる発言者とその発言時間を自動識別
DER 12.3% (AISHELL-4データセット)
音声分析
マルチスピーカー音声分析
複数のスピーカーを含む音声ファイルを分析し、各スピーカーの活動時間帯を識別
DER 19.0% (AMIデータセット)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase