W

Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech

由alefiury開發
基於Librispeech-clean-100數據集微調的性別識別模型,在測試集上F1分數達0.9993
下載量 182.33k
發布時間 : 4/24/2023

模型概述

該模型是基於wav2vec2-xls-r-300m架構的語音性別識別模型,專門用於從語音中識別說話者性別

模型特點

高精度性別識別
在Librispeech測試集上達到99.93%的F1分數
基於預訓練模型微調
利用facebook/wav2vec2-xls-r-300m預訓練模型進行遷移學習
高效訓練配置
採用混合精度訓練和梯度累積等技術優化訓練效率

模型能力

語音性別分類
英語語音處理

使用案例

語音分析
說話者性別識別
從語音片段中識別說話者性別
測試集F1分數0.9993
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase