Whisper-large-v3-ft-cv16-mn Open-source Speech Recognition Model - Achieve Accurate Speech Recognition for Free

Home

Whisper Large V3 Ft Cv16 Mn

Developed by sanchit-gandhi

A speech recognition model fine-tuned on the Common Voice 16.0 dataset based on OpenAI Whisper Large V3

Speech Recognition

Transformers

Open Source License:Apache-2.0 #Multilingual speech recognition #Low word error rate #Large-scale pretraining

Downloads 34

Release Time : 1/22/2024

Model Overview

This model is a fine-tuned version of OpenAI Whisper Large V3, focusing on automatic speech recognition (ASR) tasks, achieving a 35.22% word error rate on the Common Voice dataset.

Model Features

High-precision speech recognition

Achieves a 35.22% word error rate on the Common Voice test set, demonstrating excellent performance.

Multilingual support

Based on the Whisper architecture, capable of processing multiple languages.

Efficient fine-tuning

Targeted training on the base model improves recognition accuracy in specific domains.

Model Capabilities

Speech-to-text

Multilingual speech recognition

Long audio processing

Use Cases

Speech transcription

Automatic meeting minutes generation

Automatically convert meeting recordings into text transcripts

Approximately 65% accuracy (inferred based on WER metric)

Podcast subtitle generation

Automatically generate subtitles for podcast content

Assistive technology

Hearing impairment assistance

Real-time speech-to-text assistance for the hearing impaired

Training Loss	Epoch	Step	Validation Loss	Wer
0.1552	4.35	500	0.5883	51.6576
0.007	8.7	1000	0.4691	35.2228

Property	Details
Base Model	openai/whisper-large-v3
Tags	generated_from_trainer
Datasets	common_voice_16_0
Metrics	wer
Model Index Name	openai/whisper-large-v3
Task	Automatic Speech Recognition
Dataset Name	common_voice_16_0
Dataset Config	mn
Dataset Split	test
Dataset Args	mn
Wer Value	35.22282608695652

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Whisper Large V3 Ft Cv16 Mn

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 openai/whisper-large-v3

🚀 Quick Start

📚 Documentation

Model description

Intended uses & limitations

Training and evaluation data

Training procedure

Training hyperparameters

Training results

Framework versions

📄 License

📦 Model Information