reverb-diarization-v1开源说话人日志模型 - 改进版精准识别说话人，误差显著降低

首页

Reverb Diarization V1

由 Revai 开发

基于pyannote3.0改进的说话人日志模型，在多个测试集上WDER相对降低16.5%

说话人处理

PyTorch

开源协议:其他 #低WDER日志 #多说话人识别 #金融电话分析

下载量 197.74k

发布时间 : 8/27/2024

模型简介

用于语音识别中的说话人日志任务，能够识别和区分音频中的不同说话人

模型特点

性能提升

相比基准pyannote3.0模型，WDER相对降低16.5%

大规模评估

在五个不同测试集超过1,250,000个标记上进行评估

易用性

提供简单的Python API接口，支持RTTM格式输出

模型能力

说话人识别

语音分割

多说话人区分

使用案例

语音处理

会议记录

自动区分会议录音中的不同发言人

提高会议记录准确性

访谈分析

识别访谈音频中的采访者和受访者

便于内容整理和分析

测试集	WDER
earnings21	0.047
rev16	0.077

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Reverb Diarization V1

模型简介

模型特点

模型能力

使用案例

🚀 Reverb 语音分离模型 V1

🚀 快速开始

✨ 主要特性

💻 使用示例

基础用法

📚 详细文档

📄 许可证