The wav2vec2-base-20sec-timit-and-dementiabank open-source speech recognition model accurately recognizes English speech.

Wav2vec2 Base 20sec Timit And Dementiabank

Developed by shields

A speech recognition model fine-tuned based on facebook/wav2vec2-base, trained on TIMIT and DementiaBank datasets, suitable for English speech recognition tasks.

Speech Recognition

Transformers

Open Source License:Apache-2.0 #Speech Recognition Optimization #Medical Voice Analysis #Low Word Error Rate

Downloads 18

Release Time : 3/2/2022

Model Overview

This model is a fine-tuned version of wav2vec2-base, focusing on English speech recognition, specifically optimized for TIMIT and DementiaBank datasets.

Model Features

Efficient Fine-tuning

Fine-tuned based on the wav2vec2-base model, achieving good recognition performance on specific datasets.

Low Word Error Rate

Achieved a word error rate (WER) of 0.2313 on the evaluation set, demonstrating good performance.

Mixed Precision Training

Used native AMP for mixed precision training, improving training efficiency.

Model Capabilities

English Speech Recognition

Audio to Text Conversion

Use Cases

Healthcare

Dementia Voice Analysis

Can be used to analyze voice characteristics of dementia patients

Speech Recognition Applications

English Speech Transcription

Convert English speech content into text

Word error rate 0.2313

Training Loss	Epoch	Step	Validation Loss	Wer
3.6839	2.53	500	2.7287	1.0
0.8708	5.05	1000	0.5004	0.3490
0.2879	7.58	1500	0.4411	0.2872
0.1877	10.1	2000	0.4359	0.2594
0.1617	12.63	2500	0.4404	0.2492
0.1295	15.15	3000	0.4356	0.2418
0.1146	17.68	3500	0.4338	0.2313

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Base 20sec Timit And Dementiabank

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 wav2vec2-base-20sec-timit-and-dementiabank

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License