Open-source Russian sentiment analysis model - spec_soul_ast_aug: Supports audio spectrum input and includes data augmentation features

Spec Soul Ast Aug

Developed by abletobetable

A Russian emotion analysis model fine-tuned based on the AST architecture, supporting audio spectrogram input with data augmentation capabilities

Audio Classification

Transformers

Other#Russian Audio Emotion Analysis #Spectrogram Transformer Fine-tuning #Audio Enhancement Support

Downloads 14

Release Time : 4/22/2023

Model Overview

This model is an audio classification model for Russian emotion analysis, based on the Audio Spectrogram Transformer (AST) architecture, fine-tuned from MIT's pre-trained model. It supports identifying emotion categories from audio spectrograms, suitable for Russian speech emotion analysis scenarios.

Model Features

Russian Emotion Recognition

Emotion analysis capability specifically designed for Russian speech

Spectrogram Transformer Architecture

Uses AST architecture to process audio spectrogram features, effectively capturing speech emotion characteristics

Data Augmentation Support

Includes audio data augmentation during training to improve model robustness

Telegram Integration

Provides a ready-to-deploy Telegram bot implementation

Model Capabilities

Russian Speech Emotion Classification

Audio Spectrogram Analysis

Real-time Emotion Recognition

Use Cases

Emotion Analysis

Customer Service Call Analysis

Analyze customer emotions in Russian customer service calls

Can identify emotional states such as anger, satisfaction, etc.

Mental Health Monitoring

Monitor psychological states like depression through voice changes

Voice Interaction

Smart Voice Assistant

Add emotion response capability to Russian voice assistants

Property	Details
Datasets	Aniemore/resd
Language	ru
Metrics	accuracy
Library Name	transformers
Pipeline Tag	audio-classification

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Spec Soul Ast Aug

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Finetuned Audio Spectrogram Transformer for Russian Sentiment Analysis

📚 Documentation

General Information

Initial State

Repository