G

Gender Cls Svm Ecapa Voxceleb

由griko開發
基於SpeechBrain的ECAPA-TDNN說話人嵌入模型與SVM分類器,可從音頻輸入中預測說話人性別。
下載量 29
發布時間 : 11/9/2024

模型概述

本模型結合ECAPA-TDNN說話人嵌入與SVM分類器,用於從音頻中識別說話人性別,支持二元分類(男/女)。

模型特點

高精度分類
在VoxCeleb2測試集上達到98.9%準確率,TIMIT測試集上達99.6%準確率
多數據集驗證
已在VoxCeleb2、Mozilla Common Voice和TIMIT數據集上驗證性能
優化分類器
通過Optuna進行200次調優的SVM分類器
自動預處理
支持自動音頻格式轉換(16kHz/單聲道)和語音活動檢測

模型能力

性別分類
說話人特徵提取
音頻處理
聲紋分析

使用案例

語音分析
說話人性別識別
從音頻中自動識別說話人性別
高準確率(VoxCeleb2: 98.9%)
語音數據集處理
數據集性別標註
為未標註的語音數據集自動添加性別標籤
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase