S

Spkrec Xvect Voxceleb

由 speechbrain 开发
这是一个使用SpeechBrain预训练的TDNN模型,用于提取说话人嵌入向量,主要应用于说话人验证和识别任务。
下载量 27.68k
发布时间 : 3/2/2022

模型简介

该系统由TDNN模型结合统计池化组成,使用分类交叉熵损失进行训练,能够从音频中提取说话人的特征嵌入向量。

模型特点

高效的说话人嵌入提取
能够快速准确地从音频中提取说话人的特征嵌入向量。
基于VoxCeleb数据集训练
使用大众名人1+大众名人2的训练数据进行训练,具有较高的识别准确率。
自动音频预处理
自动对输入音频进行标准化处理,包括重采样和单声道选择。

模型能力

说话人验证
说话人识别
音频特征提取

使用案例

安全认证
语音身份验证
用于电话银行或其他需要语音身份验证的场景。
在VoxCeleb1测试集(清洗版)上达到3.2%的等错误率(EER)。
智能设备
个性化语音助手
为不同用户提供个性化的语音助手服务。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase