V

Voice Gender Classifier

由JaesungHuh開發
基於ECAPA-TDNN架構的預訓練模型,用於從人類語音中分類性別
下載量 14.01k
發布時間 : 5/13/2024

模型概述

該模型使用預訓練的ECAPA-TDNN架構進行微調,專門用於從語音中識別說話者的性別。在VoxCeleb1測試集上達到98.7%的準確率。

模型特點

高準確率
在VoxCeleb1測試集上達到98.7%的準確率
基於ECAPA-TDNN
使用最先進的說話人驗證模型架構
簡單易用
提供直接的預測接口,只需輸入音頻文件即可獲取結果

模型能力

語音性別分類
音頻特徵提取

使用案例

語音分析
說話者性別識別
從語音片段中識別說話者的性別
98.7%的準確率(VoxCeleb1測試集)
語音處理預處理
語音數據分類
在語音處理流程中預先分類語音性別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase