W

Wav2vec2 Large Robust 6 Ft Age Gender

由 audeering 开发
该模型通过微调Wav2Vec2-Large-Robust,能够从原始音频中预测说话者的年龄和性别。
下载量 19.29k
发布时间 : 9/4/2023

模型简介

本模型接收原始音频信号作为输入,输出年龄预测值(范围约0...1对应0...100岁)以及儿童/女性/男性性别概率。同时提供最后一层transformer的池化状态。

模型特点

多数据集训练
模型在aGender、Mozilla Common Voice、Timit和Voxceleb 2等多个数据集上训练,提高了泛化能力。
轻量级架构
仅使用前六个transformer层,在保持性能的同时减少了计算资源需求。
多任务输出
同时输出年龄预测和性别分类结果,以及最后一层transformer的池化状态。

模型能力

音频信号处理
年龄预测
性别分类
特征提取

使用案例

语音分析
人口统计研究
用于分析语音样本中不同年龄和性别群体的分布特征
个性化服务
根据用户语音特征提供个性化推荐或服务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase