W

Wav2vec2 Large Robust 24 Ft Age Gender

由audeering開發
該模型以原始音頻信號作為輸入,輸出年齡預測值以及性別概率(兒童/女性/男性),同時輸出最後一層transformer的池化狀態。
下載量 44.13k
發布時間 : 9/4/2023

模型概述

通過微調Wav2Vec2-Large-Robust在多個數據集上訓練得到的語音年齡與性別識別模型,支持從原始音頻中預測說話者年齡和性別。

模型特點

多數據集訓練
在aGender、Mozilla Common Voice、Timit和Voxceleb 2等多個數據集上訓練,提高模型泛化能力
端到端處理
直接處理原始音頻信號,無需複雜的特徵工程
多任務輸出
同時輸出年齡預測、性別概率和transformer池化狀態
魯棒性強
基於Wav2Vec2-Large-Robust架構,對噪聲和語音變化具有較強魯棒性

模型能力

語音年齡識別
語音性別分類
語音特徵提取

使用案例

語音分析
說話者人口統計
從語音中分析說話者的年齡和性別分佈
可輸出0-100歲的年齡預測和性別概率
語音交互系統
為語音助手提供用戶人口統計信息,實現個性化交互
語音數據分析
從大量語音數據中提取說話者年齡性別特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase