The ast-finetuned-audioset-10-10-0.4593 Open-source Model - Achieving Precise Audio Classification Tasks

Home

Ast Finetuned Audioset 10 10 0.4593

Developed by Xenova

Audio Spectrogram Transformer (AST) model fine-tuned on the AudioSet dataset for audio classification tasks

Audio Classification

Transformers

#Audio Classification #Web Adaptation #ONNX Format

Downloads 82

Release Time : 6/27/2023

Model Overview

This model is a variant of the Audio Spectrogram Transformer (AST) architecture, specifically fine-tuned on the AudioSet dataset, suitable for general audio classification tasks. It can recognize and classify various audio events and sound categories.

Model Features

Transformer-based Audio Processing

Uses Vision Transformer architecture to process audio spectrograms, enabling global modeling of audio signals

AudioSet Fine-tuning

Fine-tuned on the large-scale AudioSet dataset, capable of recognizing a wide range of audio events

Web Adaptation

Provides ONNX format weights that can be directly run in browsers via Transformers.js

Model Capabilities

Audio Classification

Sound Event Detection

Environmental Sound Recognition

Use Cases

Smart Home

Pet Sound Monitoring

Detects and classifies sounds made by pets (e.g., cat meows, dog barks)

Can accurately identify common pet sounds

Content Moderation

Audio Content Classification

Automatically classifies user-uploaded audio content

Property	Details
Base Model	MIT/ast-finetuned-audioset-10-10-0.4593
Library Name	transformers.js

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Ast Finetuned Audioset 10 10 0.4593

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Audio Classification Model with Transformers.js

🚀 Quick Start

📦 Installation

💻 Usage Examples

Basic Usage