wav2vec2-base-timit-demo-colab0 Open-source Speech Recognition Model

Home

Wav2vec2 Base Timit Demo Colab0

Developed by hassnain

A speech recognition model fine-tuned on the TIMIT dataset based on facebook/wav2vec2-base

Speech Recognition

Transformers

Open Source License:Apache-2.0 #Speech Recognition #Low Word Error Rate #TIMIT Fine-tuning

Downloads 20

Release Time : 4/30/2022

Model Overview

This is a pre-trained model for English speech recognition, optimized for recognition performance through fine-tuning on the TIMIT dataset

Model Features

Based on wav2vec2 architecture

Utilizes the wav2vec2-base architecture developed by Facebook, with excellent speech feature extraction capabilities

Fine-tuned on TIMIT dataset

Fine-tuned on the standard TIMIT speech dataset, optimizing English speech recognition performance

Relatively lightweight

Based on the base version rather than the large version, suitable for deployment in resource-constrained environments

Model Capabilities

English speech recognition

Audio to text conversion

Automatic speech transcription

Use Cases

Speech transcription

Automated meeting minutes

Automatically convert English meeting recordings into text transcripts

Word error rate 0.7734

Voice command recognition

Recognize English voice commands

Education

Pronunciation assessment

Used for pronunciation evaluation of English learners

Training Loss	Epoch	Step	Validation Loss	Wer
4.8077	7.04	500	3.1554	1.0
2.8549	14.08	1000	2.0683	1.0846
1.3297	21.13	1500	1.2084	0.7984
0.6725	28.17	2000	1.1808	0.7734

Property	Details
Model Type	wav2vec2 - base - timit - demo - colab0
Training Framework Versions	Transformers 4.11.3, Pytorch 1.11.0+cu113, Datasets 1.18.3, Tokenizers 0.10.3

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Base Timit Demo Colab0

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 wav2vec2-base-timit-demo-colab0

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License