whisper-base-finetuned-gtzan開源語音分類模型 - 免費部署精準識別音樂流派

Whisper Base Finetuned Gtzan

由vineetsharma開發

基於OpenAI的whisper-base模型在GTZAN數據集上微調的語音分類模型，主要用於音樂流派分類任務。

下載量 15

發布時間 : 7/3/2023

模型概述

該模型是基於whisper-base架構的變體，專門針對音樂流派分類任務進行了優化。在GTZAN數據集上取得了87%的準確率。

高準確率

在GTZAN測試集上達到87%的分類準確率

微調優化

基於whisper-base模型針對音樂分類任務專門優化

輕量級

基於whisper-base架構，相對輕量（推斷）

音樂流派分類

音頻特徵提取

音樂分析

音樂流派自動分類

對音樂片段進行流派分類

準確率87%

音樂推薦系統

作為音樂推薦系統的預處理組件