Gender Cls Svm Ecapa Voxceleb
G
Gender Cls Svm Ecapa Voxceleb
grikoによって開発
SpeechBrainのECAPA-TDNN話者埋め込みモデルとSVM分類器を基に、音声入力から話者の性別を予測します。
ダウンロード数 29
リリース時間 : 11/9/2024
モデル概要
本モデルはECAPA-TDNN話者埋め込みとSVM分類器を組み合わせ、音声から話者の性別を識別するために使用され、二項分類(男性/女性)をサポートします。
モデル特徴
高精度分類
VoxCeleb2テストセットで98.9%の精度、TIMITテストセットで99.6%の精度を達成
複数データセット検証
VoxCeleb2、Mozilla Common Voice、TIMITデータセットで性能を検証済み
最適化分類器
Optunaによる200回のチューニングを経たSVM分類器
自動前処理
自動音声フォーマット変換(16kHz/モノラル)と音声活動検出をサポート
モデル能力
性別分類
話者特徴抽出
音声処理
声紋分析
使用事例
音声分析
話者性別識別
音声から話者の性別を自動識別
高精度(VoxCeleb2: 98.9%)
音声データセット処理
データセット性別ラベリング
ラベル付けされていない音声データセットに自動的に性別ラベルを追加
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98