A

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

由eonrad開發
該模型是基於AST架構在GTZAN音樂分類數據集上微調的音頻分類模型,準確率達89%
下載量 1
發布時間 : 10/25/2024

模型概述

基於Audio Spectrogram Transformer (AST)架構的音頻分類模型,專門針對音樂流派分類任務進行了微調

模型特點

高準確率
在GTZAN音樂分類數據集上達到89%的準確率
基於Transformer架構
採用Audio Spectrogram Transformer處理音頻頻譜圖
遷移學習
在AudioSet預訓練模型基礎上進行微調

模型能力

音樂流派分類
音頻特徵提取
頻譜圖分析

使用案例

音樂分析
音樂流派自動分類
自動識別音頻文件的音樂流派
在GTZAN數據集上達到89%準確率
音頻內容分析
音頻內容分類
對音頻內容進行分類和標記
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase