Open-source audio classification model ast-finetuned-audioset - Precise classification, free deployment, and enjoy the convenience of audio processing

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50 Slower LR

Developed by xpariz10

Audio classification model based on AST architecture, pre-trained on the AudioSet dataset and fine-tuned on the ESC-50 dataset

Audio Classification

Transformers

Open Source License:Bsd-3-clause #Audio Classification #High Accuracy #Transfer Learning

Downloads 22

Release Time : 12/10/2022

Model Overview

This model is an audio classification model using the AST (Audio Spectrogram Transformer) architecture. It was first pre-trained on the AudioSet dataset and then fine-tuned on the ESC-50 environmental sound classification dataset.

Model Features

Transformer-based Audio Processing

Adopts AST architecture, successfully applying Transformer to audio spectrogram processing

Two-stage Training

Pre-trained on the large AudioSet dataset first, then fine-tuned on the ESC-50 dataset

High Accuracy

Achieves 89.29% accuracy on the evaluation set

Model Capabilities

Audio Classification

Environmental Sound Recognition

Sound Event Detection

Use Cases

Smart Home

Appliance Sound Recognition

Identify sounds from different household appliances

Environmental Monitoring

Natural Environment Sound Classification

Identify sounds in different environments like forests, cities, etc.

Training Loss	Epoch	Step	Validation Loss	Accuracy
9.3646	1.0	28	6.0136	0.0893
2.9631	2.0	56	2.0175	0.5357
1.2435	3.0	84	1.1471	0.7679
0.7699	4.0	112	0.8559	0.875
0.5911	5.0	140	0.7837	0.8929

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50 Slower LR

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ast-finetuned-audioset-10-10-0.4593-finetuning-ESC-50-slower-LR

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

🔧 Technical Details

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License