ASTie-finetuned-on-shEMO Open-source Model - Free Deployment for Speech Emotion Recognition Tasks

Astie Finetuned On Shemo

Developed by minoosh

This model is a fine-tuned version of the AST model on the shEMO dataset, primarily used for speech emotion recognition tasks.

Audio Classification

Transformers

Open Source License:Bsd-3-clause #Speech Emotion Recognition #High Accuracy #Audio Classification

Downloads 24

Release Time : 4/27/2023

Model Overview

ASTie is a speech emotion recognition model based on the Audio Spectrogram Transformer (AST) architecture, fine-tuned on the shEMO dataset, capable of identifying emotional features in speech.

Model Features

High Accuracy

Achieves 81.67% accuracy on the evaluation set.

Efficient Inference

Can process approximately 8 samples per second.

AST-based Architecture

Utilizes the advanced Audio Spectrogram Transformer architecture.

Model Capabilities

Speech Emotion Recognition

Audio Classification

Use Cases

Emotion Analysis

Customer Service Emotion Monitoring

Real-time analysis of customer emotions in service calls.

81.67% recognition accuracy.

Psychological State Assessment

Evaluates the speaker's psychological state through voice analysis.

Property	Details
Model Name	ASTie-finetuned-on-shEMO
Base Model	minoosh/ast-finetuned-audioset-10-10-0.4593-finetuned-ie
Dataset	None

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Astie Finetuned On Shemo

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 ASTie-finetuned-on-shEMO

🚀 Quick Start

📚 Documentation

Model Information

Evaluation Results

Training Procedure

Training Hyperparameters

Framework Versions

📄 License