Open-source speech recognition model wav2vec2-base-timit-demo-colab3

Wav2vec2 Base Timit Demo Colab3

Developed by sherry7144

A speech recognition model fine-tuned on the TIMIT dataset based on the facebook/wav2vec2-base model

Downloads 24

Release Time : 5/2/2022

Model Overview

This is a pre-trained model for English speech recognition, optimized for recognition performance through fine-tuning on specific datasets

Efficient Fine-tuning

Fine-tuned based on the pre-trained wav2vec2-base model, optimizing speech recognition performance for specific scenarios

Word Error Rate Optimization

After fine-tuning, achieved a word error rate (WER) of 0.6055 on the evaluation set

English Speech Recognition

Audio-to-Text Conversion

Speech Transcription

Meeting Minutes

Automatically convert English meeting recordings into text transcripts

Word error rate 0.6055

Voice Notes

Convert English voice notes into searchable text

Training Loss	Epoch	Step	Validation Loss	Wer
5.0927	13.89	500	2.7346	1.0
0.9983	27.78	1000	0.8344	0.6055

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base