W

Wav2vec2 Large Robust 24 Ft Age Gender

由 audeering 开发
该模型以原始音频信号作为输入,输出年龄预测值以及性别概率(儿童/女性/男性),同时输出最后一层transformer的池化状态。
下载量 44.13k
发布时间 : 9/4/2023

模型简介

通过微调Wav2Vec2-Large-Robust在多个数据集上训练得到的语音年龄与性别识别模型,支持从原始音频中预测说话者年龄和性别。

模型特点

多数据集训练
在aGender、Mozilla Common Voice、Timit和Voxceleb 2等多个数据集上训练,提高模型泛化能力
端到端处理
直接处理原始音频信号,无需复杂的特征工程
多任务输出
同时输出年龄预测、性别概率和transformer池化状态
鲁棒性强
基于Wav2Vec2-Large-Robust架构,对噪声和语音变化具有较强鲁棒性

模型能力

语音年龄识别
语音性别分类
语音特征提取

使用案例

语音分析
说话者人口统计
从语音中分析说话者的年龄和性别分布
可输出0-100岁的年龄预测和性别概率
语音交互系统
为语音助手提供用户人口统计信息,实现个性化交互
语音数据分析
从大量语音数据中提取说话者年龄性别特征
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase