Reverb Diarization V1_カテゴリ| AIbaseモデルライブラリ

ホーム

Reverb Diarization V1

Revaiによって開発

pyannote3.0を改良したスピーカーダイアリゼーションモデルで、複数のテストセットでWDERを16.5%相対的に低減

話者の処理

PyTorch

オープンソースライセンス:その他 #低WDERログ #マルチスピーカー識別 #金融電話分析

ダウンロード数 197.74k

リリース時間 : 8/27/2024

モデル概要

音声認識におけるスピーカーダイアリゼーションタスク用で、音声内の異なる話者を識別・区別可能

モデル特徴

性能向上

ベンチマークpyannote3.0モデルと比較し、WDERを16.5%相対的に低減

大規模評価

5つの異なるテストセットで1,250,000以上のラベルを評価

使いやすさ

シンプルなPython APIインターフェースを提供し、RTTM形式出力をサポート

モデル能力

スピーカー識別

音声セグメンテーション

マルチスピーカー区別

使用事例

音声処理

会議議事録

会議録音から異なる発言者を自動区別

会議議事録の精度向上

インタビュー分析

インタビュー音声中のインタビュアーと回答者を識別

内容整理と分析の容易化

🚀 Reverb 話者分離 V1

Reverb 話者分離 V1は、自動音声認識における話者分離機能を提供するモデルです。ベースラインのpyannote3.0モデルと比較して、WDER（Word Diarization Error Rate）が16.5%相対的に改善されています。

🚀 クイックスタート

モデルの詳細や性能については、Arxivを参照してください。この話者分離モデルの実行方法についての詳細情報は、https://github.com/revdotcom/reverb/tree/main/diarization を参照してください。

Reverb 話者分離 V1は、5つの異なるテストセットで合計125万以上のトークンを評価した結果、ベースラインのpyannote3.0モデルと比較して、WDER（Word Diarization Error Rate）が16.5%相対的に改善されています。

テストセット	WDER
earnings21	0.047
rev16	0.077

💻 使用例

基本的な使用法

# taken from https://huggingface.co/pyannote/speaker-diarization-3.1 - see for more details
# instantiate the pipeline
from pyannote.audio import Pipeline
pipeline = Pipeline.from_pretrained(
  "Revai/reverb-diarization-v1",
  use_auth_token="HUGGINGFACE_ACCESS_TOKEN_GOES_HERE")

# run the pipeline on an audio file
diarization = pipeline("audio.wav")

# dump the diarization output to disk using RTTM format
with open("audio.rttm", "w") as rttm:
    diarization.write_rttm(rttm)

📚 ドキュメント

このモデルを使用する場合は、以下の引用を使用してください。

@misc{bhandari2024reverbopensourceasrdiarization,
      title={Reverb: Open-Source ASR and Diarization from Rev}, 
      author={Nishchal Bhandari and Danny Chen and Miguel Ángel del Río Fernández and Natalie Delworth and Jennifer Drexler Fox and Migüel Jetté and Quinten McNamara and Corey Miller and Ondřej Novotný and Ján Profant and Nan Qin and Martin Ratajczak and Jean-Philippe Robichaud},
      year={2024},
      eprint={2410.03930},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2410.03930}, 
}