W

Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech

alefiuryによって開発
Librispeech-clean-100データセットで微調整された性別認識モデルで、テストセットでF1スコア0.9993を達成
ダウンロード数 182.33k
リリース時間 : 4/24/2023

モデル概要

このモデルはwav2vec2-xls-r-300mアーキテクチャに基づく音声性別認識モデルで、音声から話者の性別を識別するために特別に設計されています

モデル特徴

高精度性別認識
Librispeechテストセットで99.93%のF1スコアを達成
事前学習モデルに基づく微調整
facebook/wav2vec2-xls-r-300m事前学習モデルを利用した転移学習
効率的なトレーニング構成
混合精度トレーニングや勾配蓄積などの技術でトレーニング効率を最適化

モデル能力

音声性別分類
英語音声処理

使用事例

音声分析
話者性別識別
音声クリップから話者の性別を識別
テストセットF1スコア0.9993
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase