wav2vec2-base_toy_train_data_random_noise Open-Source Speech Recognition Model - Handling Speech Recognition of Random Noise

Wav2vec2 Base Toy Train Data Random Noise

Developed by scasutt

This model is a fine-tuned speech recognition model based on facebook/wav2vec2-base using toy training data, primarily designed for speech recognition tasks in random noise environments.

Speech Recognition

Transformers

Open Source License:Apache-2.0 #Speech Recognition #Noise Robustness #Few-shot Fine-tuning

Downloads 22

Release Time : 3/27/2022

Model Overview

This is a fine-tuned wav2vec2-base model specifically designed for speech recognition in random noise environments. The model achieved a word error rate of 0.7351 on the evaluation set.

Model Features

Noise Environment Adaptation

Optimized for random noise environments, improving speech recognition accuracy in noisy conditions

Based on wav2vec2 Architecture

Built upon the powerful wav2vec2-base model, inheriting its excellent speech feature extraction capabilities

Model Capabilities

Speech Recognition

Speech processing in noisy environments

Use Cases

Speech Transcription

Speech Transcription in Noisy Environments

Convert speech containing random noise into text

Word Error Rate 0.7351

Training Loss	Epoch	Step	Validation Loss	Wer
3.128	2.1	250	3.5052	1.0
3.0423	4.2	500	2.9312	1.0
1.4109	6.3	750	1.2618	0.8915
0.9132	8.4	1000	1.1074	0.8436
0.7146	10.5	1250	1.0397	0.7876
0.5418	12.6	1500	1.0359	0.7662
0.4649	14.7	1750	1.0469	0.7467
0.4127	16.8	2000	1.0655	0.7404
0.3881	18.9	2250	1.0909	0.7351

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Base Toy Train Data Random Noise

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 wav2vec2-base_toy_train_data_random_noise

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

🔧 Technical Details

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License