P

Pyannote Speaker Diarization 31

collinbarnwellによって開発
Pyannote.audioの話者ログパイプラインで、音声内の異なる話者を自動検出および分割するためのものです。
ダウンロード数 835
リリース時間 : 2/8/2024

モデル概要

これは話者ログ用のオープンソースパイプラインで、音声内の異なる話者を自動検出し、話者の変化を識別し、重なり音声検出をサポートします。16kHzサンプリングのモノラル音声を処理し、話者ログ情報を出力します。

モデル特徴

純粋なPyTorch実装
問題のあるonnxruntimeの使用を削除し、話者分割と埋め込みはすべて純粋なPyTorchで実行され、デプロイを簡素化し、推論を高速化する可能性があります。
自動処理
完全に自動化された処理で、手動の音声活動検出や話者数の指定は必要ありません。
多形式サポート
ステレオ/マルチチャンネル音声を自動的にモノラルにダウンミックスし、異なるサンプリングレートの音声を自動的にリサンプリングすることをサポートします。
話者数制御
話者数を指定するか、数の範囲(min_speakers/max_speakers)を提供することができます。

モデル能力

話者変化検出
音声活動検出
重なり音声検出
自動話者識別
音声処理

使用事例

会議記録
会議記録分析
会議録音内の異なる発言者の時間帯を自動識別します。
会議記録の効率を向上させ、発言タイムラインを自動生成します。
メディア分析
ラジオ番組分析
ラジオ番組内の司会者とゲストの発言時間分布を分析します。
コンテンツ制作者が番組構成を最適化するのに役立ちます。
音声研究
音声対話研究
複数人の対話内の発言パターンと重なり音声を研究します。
音声対話システムに基礎データを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase