ast-finetuned-audioset開源音頻分類模型 - 精準完成音樂分類，準確率達89%

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由eonrad開發

該模型是基於AST架構在GTZAN音樂分類數據集上微調的音頻分類模型，準確率達89%

下載量 1

發布時間 : 10/25/2024

模型概述

基於Audio Spectrogram Transformer (AST)架構的音頻分類模型，專門針對音樂流派分類任務進行了微調

高準確率

在GTZAN音樂分類數據集上達到89%的準確率

基於Transformer架構

採用Audio Spectrogram Transformer處理音頻頻譜圖

遷移學習

在AudioSet預訓練模型基礎上進行微調

音樂流派分類

音頻特徵提取

頻譜圖分析

音樂分析

音樂流派自動分類

自動識別音頻文件的音樂流派

在GTZAN數據集上達到89%準確率

音頻內容分析

音頻內容分類

對音頻內容進行分類和標記

屬性	詳情
庫名稱	transformers
許可證	bsd-3-clause
基礎模型	MIT/ast-finetuned-audioset-10-10-0.4593
標籤	generated_from_trainer
數據集	marsyas/gtzan
評估指標	準確率
模型名稱	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
任務類型	音頻分類
數據集名稱	GTZAN
數據集類型	marsyas/gtzan
數據集配置	all
數據集分割	train
數據集參數	all
評估指標值	0.89（準確率）