🎹 重複話者検出
このオープンソースモデルは、重複する話者の音声を検出するためのものです。音声データ内で同時に発話している話者を特定することができ、自動音声認識や話者分離などのタスクに役立ちます。
🚀 クイックスタート
このモデルを使用するには、まずpyannote.audio 2.1
をインストールする必要があります。インストール手順を参照してください。
from pyannote.audio import Pipeline
pipeline = Pipeline.from_pretrained("pyannote/overlapped-speech-detection",
use_auth_token="ACCESS_TOKEN_GOES_HERE")
output = pipeline("audio.wav")
for speech in output.get_timeline().support():
...
✨ 主な機能
- 音声データ内の重複する話者を検出します。
pyannote.audio 2.1
に依存しており、最新の技術を活用しています。
📦 インストール
このモデルを使用するには、pyannote.audio 2.1
をインストールする必要があります。詳細なインストール手順はこちらを参照してください。
💻 使用例
基本的な使用法
from pyannote.audio import Pipeline
pipeline = Pipeline.from_pretrained("pyannote/overlapped-speech-detection",
use_auth_token="ACCESS_TOKEN_GOES_HERE")
output = pipeline("audio.wav")
for speech in output.get_timeline().support():
...
📚 ドキュメント
サポート
引用
@inproceedings{Bredin2021,
Title = {{End-to-end speaker segmentation for overlap-aware resegmentation}},
Author = {{Bredin}, Herv{\'e} and {Laurent}, Antoine},
Booktitle = {Proc. Interspeech 2021},
Address = {Brno, Czech Republic},
Month = {August},
Year = {2021},
}
@inproceedings{Bredin2020,
Title = {{pyannote.audio: neural building blocks for speaker diarization}},
Author = {{Bredin}, Herv{\'e} and {Yin}, Ruiqing and {Coria}, Juan Manuel and {Gelly}, Gregory and {Korshunov}, Pavel and {Lavechin}, Marvin and {Fustes}, Diego and {Titeux}, Hadrien and {Bouaziz}, Wassim and {Gill}, Marie-Philippe},
Booktitle = {ICASSP 2020, IEEE International Conference on Acoustics, Speech, and Signal Processing},
Address = {Barcelona, Spain},
Month = {May},
Year = {2020},
}
📄 ライセンス
このモデルはMITライセンスの下で提供されています。
⚠️ 重要提示
収集された情報は、pyannote.audioのユーザーベースに関するより良い知識を獲得し、そのメンテナがさらなる改善のための助成金を申請するのに役立ちます。学術研究者の場合は、モデルを使用して独自の出版物で関連する論文を引用してください。企業で働いている場合は、pyannote.audioの開発に貢献することを検討してください(例:無制限の寄付を通じて)。また、話者分離や機械聴取に関する科学的なコンサルティングサービスも提供しています。
💡 使用建议
このオープンソースモデルを本番環境で使用する場合は、より良いオプションを得るためにpyannoteAIに切り替えることを検討してください。
属性 |
详情 |
モデルタイプ |
重複話者検出モデル |
学習データ |
ami、dihard、voxconverse |