P

Pyannote Segmentation 30

collinbarnwellによって開発
これは音声処理用の話者分割モデルで、音声活動、重複音声、複数話者を検出できます。
ダウンロード数 873
リリース時間 : 2/9/2024

モデル概要

このモデルは16kHzサンプリングの10秒モノラル音声を処理し、7つのカテゴリを含む話者分割結果を出力します。音声活動検出と重複音声検出をサポートしています。

モデル特徴

複数話者検出
最大3人の話者とその重複部分を同時に検出できます。
短時間処理
10秒の音声クリップの分割タスクに特化して最適化されています。
マルチタスク出力
音声活動検出と重複音声検出のタスクを同時にサポートします。

モデル能力

話者分割
音声活動検出
重複音声検出
複数話者認識

使用事例

会議記録
会議発言者識別
会議録音中の異なる発言者とその発言時間帯を自動識別
会議記録効率を向上させ、自動的に発言記録を生成
音声分析
重複音声検出
会話中の複数人が同時に話している状況を検出
重複音声シナリオでの音声認識システムの性能改善
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase