W

Whisper Base Finetuned Gtzan

由vineetsharma開發
基於OpenAI的whisper-base模型在GTZAN數據集上微調的語音分類模型,主要用於音樂流派分類任務。
下載量 15
發布時間 : 7/3/2023

模型概述

該模型是基於whisper-base架構的變體,專門針對音樂流派分類任務進行了優化。在GTZAN數據集上取得了87%的準確率。

模型特點

高準確率
在GTZAN測試集上達到87%的分類準確率
微調優化
基於whisper-base模型針對音樂分類任務專門優化
輕量級
基於whisper-base架構,相對輕量(推斷)

模型能力

音樂流派分類
音頻特徵提取

使用案例

音樂分析
音樂流派自動分類
對音樂片段進行流派分類
準確率87%
音樂推薦系統
作為音樂推薦系統的預處理組件
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase