ast-finetuned-audioset開源音頻分類模型 - 精準完成音樂流派分類任務

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由vineetsharma開發

基於AST架構的音頻分類模型，在GTZAN數據集上微調，用於音樂流派分類任務

下載量 14

發布時間 : 7/2/2023

模型概述

該模型是基於Audio Spectrogram Transformer (AST)架構的音頻分類模型，先在AudioSet數據集上預訓練，後在GTZAN音樂數據集上微調，專門用於音樂流派分類任務。

高準確率

在GTZAN測試集上達到91%的準確率

基於Transformer架構

使用Audio Spectrogram Transformer處理音頻頻譜特徵

兩階段訓練

先在AudioSet大規模數據集預訓練，後在GTZAN音樂數據集微調

音樂流派分類

音頻特徵提取

頻譜分析

音樂分析

音樂流派自動分類

對音樂片段進行流派分類

準確率91%

音樂推薦系統

作為音樂推薦系統的特徵提取組件

音頻處理

音頻內容分析

分析音頻內容特徵