R

Reverb Diarization V1

由 Revai 开发
基于pyannote3.0改进的说话人日志模型,在多个测试集上WDER相对降低16.5%
下载量 197.74k
发布时间 : 8/27/2024

模型简介

用于语音识别中的说话人日志任务,能够识别和区分音频中的不同说话人

模型特点

性能提升
相比基准pyannote3.0模型,WDER相对降低16.5%
大规模评估
在五个不同测试集超过1,250,000个标记上进行评估
易用性
提供简单的Python API接口,支持RTTM格式输出

模型能力

说话人识别
语音分割
多说话人区分

使用案例

语音处理
会议记录
自动区分会议录音中的不同发言人
提高会议记录准确性
访谈分析
识别访谈音频中的采访者和受访者
便于内容整理和分析
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase