ast-finetuned-audioset Open-source Audio Classification Model

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Developed by abnerh

This model is a fine-tuned version of Audio Spectrogram Transformer (AST) on the GTZAN music classification dataset for audio classification tasks, achieving an accuracy of 88%.

Audio Classification

Transformers

Open Source License:Bsd-3-clause #Audio Classification #High Accuracy #Music Genre Recognition

Downloads 2

Release Time : 10/16/2024

Model Overview

This is an audio classification model based on the Transformer architecture, specifically fine-tuned for music genre classification tasks.

Model Features

High Accuracy

Achieves 88% classification accuracy on the GTZAN dataset.

Transformer-based Architecture

Utilizes the Audio Spectrogram Transformer architecture, suitable for audio signal processing.

Pre-training + Fine-tuning

Pre-trained on the AudioSet dataset and fine-tuned on the GTZAN dataset.

Model Capabilities

Music Genre Classification

Audio Feature Extraction

Audio Signal Analysis

Use Cases

Music Analysis

Automatic Music Genre Classification

Automatically identifies the music genre of audio files.

88% accuracy

Music Recommendation System

Serves as a feature extraction component for music recommendation systems.

Audio Processing

Audio Content Analysis

Analyzes audio content features.

Training Loss	Epoch	Step	Validation Loss	Accuracy
0.8145	1.0	113	0.5792	0.8
0.3418	2.0	226	0.6835	0.78
0.0731	3.0	339	0.8945	0.69
0.074	4.0	452	0.5540	0.85
0.0023	5.0	565	0.5311	0.85
0.0004	6.0	678	0.4524	0.87
0.0003	7.0	791	0.4318	0.89
0.0001	8.0	904	0.4217	0.88
0.0001	9.0	1017	0.4192	0.88
0.0001	10.0	1130	0.4169	0.88

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

🔧 Technical Details

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License