ast-finetuned-audioset開源音頻分類模型 - 基於GTZAN微調，準確率達88%

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由abnerh開發

該模型是基於 Audio Spectrogram Transformer (AST) 在 GTZAN 音樂分類數據集上微調的版本，用於音頻分類任務，準確率達到 88%。

下載量 2

發布時間 : 10/16/2024

模型概述

這是一個基於 Transformer 架構的音頻分類模型，專門針對音樂流派分類任務進行了微調。

高準確率

在 GTZAN 數據集上達到 88% 的分類準確率

基於 Transformer 架構

採用 Audio Spectrogram Transformer 架構，適用於音頻信號處理

預訓練+微調

先在 AudioSet 數據集上預訓練，再在 GTZAN 數據集上微調

音樂流派分類

音頻特徵提取

音頻信號分析

音樂分析

音樂流派自動分類

自動識別音頻文件的音樂流派

準確率 88%

音樂推薦系統

作為音樂推薦系統的特徵提取組件

音頻處理

音頻內容分析

分析音頻內容特徵

任務	數據集	評估指標	值
音頻分類	GTZAN（marsyas/gtzan，訓練集 all 配置）	準確率	0.88