G

Gender Cls Svm Ecapa Voxceleb

由 griko 开发
基于SpeechBrain的ECAPA-TDNN说话人嵌入模型与SVM分类器,可从音频输入中预测说话人性别。
下载量 29
发布时间 : 11/9/2024

模型简介

本模型结合ECAPA-TDNN说话人嵌入与SVM分类器,用于从音频中识别说话人性别,支持二元分类(男/女)。

模型特点

高精度分类
在VoxCeleb2测试集上达到98.9%准确率,TIMIT测试集上达99.6%准确率
多数据集验证
已在VoxCeleb2、Mozilla Common Voice和TIMIT数据集上验证性能
优化分类器
通过Optuna进行200次调优的SVM分类器
自动预处理
支持自动音频格式转换(16kHz/单声道)和语音活动检测

模型能力

性别分类
说话人特征提取
音频处理
声纹分析

使用案例

语音分析
说话人性别识别
从音频中自动识别说话人性别
高准确率(VoxCeleb2: 98.9%)
语音数据集处理
数据集性别标注
为未标注的语音数据集自动添加性别标签
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase