distilhubert-finetuned-gtzan開源音頻分類模型

Distilhubert Finetuned Gtzan

由Gyaneshere開發

該模型是基於distilhubert在GTZAN音樂流派分類數據集上微調的音頻分類模型，準確率達84%。

下載量 5

發布時間 : 2/8/2025

模型概述

一個輕量級的音頻分類模型，專門用於音樂流派識別任務，基於DistilHuBERT架構在GTZAN數據集上微調。

高效輕量

基於DistilHuBERT的蒸餾架構，在保持性能的同時減少模型複雜度

高準確率

在GTZAN測試集上達到84%的分類準確率

快速訓練

只需10個epoch即可達到良好性能

音樂音頻分類

流派識別

音頻特徵提取

音樂分析

音樂流派自動分類

對音樂片段進行自動流派分類

10類音樂流派分類準確率84%

音樂推薦系統

作為音樂推薦系統的前端分類模塊

音頻處理

音頻內容分析

提取音頻特徵用於內容分析

屬性	詳情
庫名稱	transformers
許可證	apache-2.0
基礎模型	ntu-spml/distilhubert
數據集	marsyas/gtzan
評估指標	準確率
模型名稱	distilhubert-finetuned-gtzan