Open-source Audio Classification Model ast-finetuned-audioset - Free Deployment for Precise Music Genre Recognition

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Developed by nomad-ai

This is an audio classification model based on the AST (Audio Spectrogram Transformer) architecture, fine-tuned on the GTZAN music genre classification dataset.

Audio Classification

Transformers

Open Source License:Bsd-3-clause #Audio Classification #High Accuracy #Music Genre Recognition

Downloads 15

Release Time : 8/9/2023

Model Overview

This model is specifically designed for music genre classification tasks and can identify 10 different music genres. It processes audio spectrograms using the Transformer architecture and achieves 90% accuracy on the GTZAN dataset.

Model Features

High Accuracy

Achieves 90% accuracy on the GTZAN music genre classification task.

Transformer-based Architecture

Uses Audio Spectrogram Transformer to process audio spectrograms, effectively capturing audio features.

Pre-training + Fine-tuning

Pre-trained on the AudioSet dataset and then fine-tuned on the GTZAN dataset.

Model Capabilities

Music Genre Classification

Audio Feature Extraction

Audio Content Analysis

Use Cases

Music Services

Automatic Music Classification

Automatically classify uploaded music files for music streaming platforms.

Accurately identifies 10 different music genres.

Playlist Generation

Automatically generate personalized playlists based on music genres.

Music Research

Music Style Analysis

Assist musicology research in analyzing features of different music styles.

Property	Details
Model Name	ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan
Task	Audio Classification
Dataset	GTZAN (`marsyas/gtzan`)
Split	train
Metric (Accuracy)	0.9

Training Loss	Epoch	Step	Validation Loss	Accuracy
0.6746	1.0	112	0.6682	0.79
0.4141	2.0	225	0.5245	0.85
0.2933	3.0	337	0.3968	0.87
0.0352	4.0	450	0.3729	0.9
0.0029	5.0	562	0.6066	0.88
0.0036	6.0	675	0.5297	0.89
0.0001	7.0	787	0.5816	0.89
0.0072	8.0	900	0.5307	0.9
0.0052	9.0	1012	0.5536	0.9
0.0001	10.0	1125	0.5478	0.9
0.0001	11.0	1237	0.5201	0.9
0.0001	12.0	1350	0.5263	0.9
0.0001	13.0	1462	0.5223	0.9
0.0	14.0	1575	0.5225	0.9
0.0001	14.93	1680	0.5240	0.9

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ast-finetuned-audioset-10-10-0.4593-finetuned-gtzan

📚 Documentation

Model Overview

Model Index

Training Procedure

Training Hyperparameters

Training Results

Framework Versions

📄 License