Model Selection

High-precision Audio Recognition

# High-precision Audio Recognition

Wav2vec2 Large Emotion Detection German

A German speech emotion detection model based on wav2vec2, trained on the emo-DB dataset, capable of recognizing 7 different emotions.

Audio Classification

Transformers German

Ast Finetuned Audioset 14 14 0.443

An audio spectrogram transformer fine-tuned on the AudioSet dataset, which converts audio into spectrograms and processes them using a vision transformer architecture, achieving excellent performance in audio classification tasks.

Audio Classification

Ast Finetuned Audioset 12 12 0.447

An Audio Spectrogram Transformer (AST) fine-tuned on the AudioSet dataset, using ViT architecture to process audio spectrograms, achieving excellent performance on multiple audio classification benchmarks.

Audio Classification

Ast Finetuned Audioset 10 10 0.448

An Audio Spectrogram Transformer (AST) fine-tuned on the AudioSet dataset, utilizing a vision transformer architecture to process audio spectrograms, achieving excellent performance in audio classification tasks.

Audio Classification

Ast Finetuned Audioset 10 10 0.4593

The Audio Spectrogram Transformer (AST) is a model fine-tuned on AudioSet, which converts audio into spectrograms and applies a vision transformer for audio classification.

Audio Classification

Distil Wav2vec2 Xls R Adult Child Cls 64m

A distilled audio classification model based on XLS-R architecture for distinguishing between adult and child voices

Audio Classification

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase