W

Wav2vec2 Large Robust 6 Ft Age Gender

audeeringによって開発
このモデルはWav2Vec2-Large-Robustを微調整することで、生の音声から話者の年齢と性別を予測できます。
ダウンロード数 19.29k
リリース時間 : 9/4/2023

モデル概要

本モデルは生の音声信号を入力として受け取り、年齢予測値(範囲は約0...1で0...100歳に対応)および子供/女性/男性の性別確率を出力します。また、最後のtransformer層のプール状態も提供します。

モデル特徴

複数データセット訓練
モデルはaGender、Mozilla Common Voice、Timit、Voxceleb 2などの複数のデータセットで訓練されており、汎化能力が向上しています。
軽量アーキテクチャ
最初の6つのtransformer層のみを使用し、性能を維持しながら計算リソースの需要を削減しました。
マルチタスク出力
年齢予測と性別分類の結果、および最後のtransformer層のプール状態を同時に出力します。

モデル能力

音声信号処理
年齢予測
性別分類
特徴抽出

使用事例

音声分析
人口統計研究
音声サンプルにおける異なる年齢・性別グループの分布特性を分析するために使用
パーソナライズドサービス
ユーザーの音声特徴に基づいてパーソナライズされた推薦やサービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase