W

Wav2vec2 Xls R Adult Child Cls

由bookbot開發
基於XLS-R架構的音頻分類模型,用於區分成人和兒童語音。
下載量 20
發布時間 : 3/2/2022

模型概述

該模型是在私有成人/兒童語音分類數據集上對wav2vec2-xls-r-300m進行微調的版本,主要用於語音分類任務。

模型特點

高準確率
在評估數據集上達到94.69%的準確率和0.9508的F1值。
基於XLS-R架構
利用XLS-R架構的強大特徵提取能力進行語音分類。
高效訓練
使用梯度累積和線性學習率調度器優化訓練過程。

模型能力

音頻分類
成人/兒童語音區分

使用案例

語音分析
兒童語音識別
用於識別和分類兒童語音,適用於教育或兒童產品領域。
準確率94.69%
成人語音識別
用於識別和分類成人語音,適用於客服或語音助手領域。
F1值0.9508
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase