Open-source Audio Classification Model ast-finetuned-audioset - Accurately Complete Music Genre Classification Tasks

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Developed by vineetsharma

An audio classification model based on AST architecture, fine-tuned on the GTZAN dataset for music genre classification tasks

Audio Classification

Transformers

Open Source License:Bsd-3-clause #Audio Classification #High Accuracy #Music Genre Recognition

Downloads 14

Release Time : 7/2/2023

Model Overview

This model is an audio classification model based on the Audio Spectrogram Transformer (AST) architecture, pre-trained on the AudioSet dataset and fine-tuned on the GTZAN music dataset, specifically designed for music genre classification tasks.

Model Features

High Accuracy

Achieves 91% accuracy on the GTZAN test set

Transformer-based Architecture

Uses Audio Spectrogram Transformer to process audio spectral features

Two-stage Training

Pre-trained on the large-scale AudioSet dataset, then fine-tuned on the GTZAN music dataset

Model Capabilities

Music Genre Classification

Audio Feature Extraction

Spectral Analysis

Use Cases

Music Analysis

Automatic Music Genre Classification

Classify music clips by genre

91% accuracy

Music Recommendation System

Serve as a feature extraction component for music recommendation systems

Audio Processing

Audio Content Analysis

Analyze audio content features

Training Loss	Epoch	Step	Validation Loss	Accuracy
0.6505	1.0	113	0.6775	0.77
0.2847	2.0	226	0.6989	0.78
0.4559	3.0	339	0.5821	0.85
0.1643	4.0	452	0.6462	0.85
0.0083	5.0	565	0.6071	0.87
0.0281	6.0	678	0.5648	0.87
0.0001	7.0	791	0.4394	0.92
0.0002	8.0	904	0.4378	0.9
0.1345	9.0	1017	0.4299	0.9
0.0002	10.0	1130	0.4400	0.91

Property	Details
Model Type	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
Base Model	MIT/ast-finetuned-audioset-10-10-0.4593
Datasets	marsyas/gtzan
Metrics	accuracy

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License

📋 Model Information