W

Wav2vec2 Large Robust 24 Ft Age Gender

audeeringによって開発
このモデルは生の音声信号を入力として、年齢予測値および性別確率(子供/女性/男性)を出力し、同時に最終層transformerのプール状態を出力します。
ダウンロード数 44.13k
リリース時間 : 9/4/2023

モデル概要

Wav2Vec2-Large-Robustを複数のデータセットでファインチューニングして得られた音声年齢・性別識別モデルで、生音声から話者の年齢と性別を予測できます。

モデル特徴

複数データセット訓練
aGender、Mozilla Common Voice、Timit、Voxceleb 2など複数のデータセットで訓練され、モデルの汎化能力を向上
エンドツーエンド処理
生の音声信号を直接処理し、複雑な特徴量エンジニアリングが不要
マルチタスク出力
年齢予測、性別確率、transformerプール状態を同時出力
ロバスト性
Wav2Vec2-Large-Robustアーキテクチャに基づき、ノイズや音声変化に対して強い頑健性

モデル能力

音声年齢識別
音声性別分類
音響特徴抽出

使用事例

音声分析
話者人口統計
音声から話者の年齢・性別分布を分析
0-100歳の年齢予測と性別確率を出力可能
音声対話システム
音声アシスタントにユーザー人口統計情報を提供し、パーソナライズドな対話を実現
音声データ分析
大量の音声データから話者の年齢・性別特徴を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase