W

Wav2vec2 Large Robust 6 Ft Age Gender

由audeering開發
該模型通過微調Wav2Vec2-Large-Robust,能夠從原始音頻中預測說話者的年齡和性別。
下載量 19.29k
發布時間 : 9/4/2023

模型概述

本模型接收原始音頻信號作為輸入,輸出年齡預測值(範圍約0...1對應0...100歲)以及兒童/女性/男性性別概率。同時提供最後一層transformer的池化狀態。

模型特點

多數據集訓練
模型在aGender、Mozilla Common Voice、Timit和Voxceleb 2等多個數據集上訓練,提高了泛化能力。
輕量級架構
僅使用前六個transformer層,在保持性能的同時減少了計算資源需求。
多任務輸出
同時輸出年齡預測和性別分類結果,以及最後一層transformer的池化狀態。

模型能力

音頻信號處理
年齡預測
性別分類
特徵提取

使用案例

語音分析
人口統計研究
用於分析語音樣本中不同年齡和性別群體的分佈特徵
個性化服務
根據用戶語音特徵提供個性化推薦或服務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase