S

Segmentation 3.0

tensorlakeによって開発
これはpyannote.audioをベースにしたスピーカーセグメンテーションモデルで、音声活動、スピーカー変更、オーバーラップ音声を検出できます。
ダウンロード数 387
リリース時間 : 7/25/2024

モデル概要

このモデルは10秒16kHzサンプリングのモノラル音声を処理し、非音声、単一スピーカー、オーバーラップスピーカー検出を含む7種類のスピーカーセグメンテーション結果を出力します。

モデル特徴

マルチタスク処理
音声活動検出、スピーカーセグメンテーション、オーバーラップ音声検出を同時にサポート
効率的な処理
10秒の音声クリップに最適化されており、リアルタイム処理に適しています
複数データセットでのトレーニング
AISHELL、AliMeeting、AMIなどの複数のデータセットでトレーニングされており、汎化能力が高い

モデル能力

音声活動検出
スピーカーセグメンテーション
オーバーラップ音声検出
スピーカー変更検出

使用事例

会議分析
会議記録
会議中の異なるスピーカーを自動識別
会議記録の効率向上
音声分析
音声活動検出
音声中の音声フラグメントを識別
音声認識の前処理に使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase