T

Testv4

由anderloh開發
基於wav2vec預訓練模型在superb數據集上微調的5分類音頻分類模型
下載量 27
發布時間 : 6/20/2024

模型概述

該模型是wav2vec預訓練模型在superb數據集上的微調版本,主要用於音頻分類任務,在驗證集上準確率達到62.09%

模型特點

基於wav2vec預訓練
利用wav2vec強大的語音表示能力進行遷移學習
5分類音頻識別
能夠對音頻數據進行5種不同類別的分類
中等準確率
在驗證集上達到62.09%的準確率

模型能力

音頻分類
語音特徵提取

使用案例

語音分析
語音情感識別
識別語音中的情感類別
準確率62.09%
語音指令分類
對語音指令進行分類處理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase