G

Gender Cls Svm Ecapa Voxceleb

grikoによって開発
SpeechBrainのECAPA-TDNN話者埋め込みモデルとSVM分類器を基に、音声入力から話者の性別を予測します。
ダウンロード数 29
リリース時間 : 11/9/2024

モデル概要

本モデルはECAPA-TDNN話者埋め込みとSVM分類器を組み合わせ、音声から話者の性別を識別するために使用され、二項分類(男性/女性)をサポートします。

モデル特徴

高精度分類
VoxCeleb2テストセットで98.9%の精度、TIMITテストセットで99.6%の精度を達成
複数データセット検証
VoxCeleb2、Mozilla Common Voice、TIMITデータセットで性能を検証済み
最適化分類器
Optunaによる200回のチューニングを経たSVM分類器
自動前処理
自動音声フォーマット変換(16kHz/モノラル)と音声活動検出をサポート

モデル能力

性別分類
話者特徴抽出
音声処理
声紋分析

使用事例

音声分析
話者性別識別
音声から話者の性別を自動識別
高精度(VoxCeleb2: 98.9%)
音声データセット処理
データセット性別ラベリング
ラベル付けされていない音声データセットに自動的に性別ラベルを追加
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase