W

Wav2vec2 Base Finetuned Gtzan

由wilson-wei開發
該模型是基於facebook/wav2vec2-base在GTZAN數據集上微調的音頻分類模型,主要用於音樂流派分類任務。
下載量 14
發布時間 : 7/29/2023

模型概述

基於wav2vec2架構的音頻分類模型,在GTZAN數據集上微調,能夠識別10種不同的音樂流派。

模型特點

高準確率
在GTZAN測試集上達到84%的準確率
基於wav2vec2架構
利用自監督學習預訓練的語音表示模型
輕量級
基於wav2vec2-base版本,相對較小

模型能力

音樂流派分類
音頻特徵提取

使用案例

音樂分析
音樂流派自動分類
對音樂片段進行自動流派分類
84%準確率
音樂推薦系統
作為音樂推薦系統的特徵提取組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase