Whisper-large-v3-turbo-cantonese-yue-english open-source speech recognition model - Supports high-precision transcription of Cantonese and English

Whisper Large V3 Turbo Cantonese Yue English

Developed by JackyHoCL

A Cantonese and English mixed speech recognition model optimized based on the Whisper architecture, supporting high-precision bilingual transcription

Speech Recognition

Transformers

Open Source License:MIT #Cantonese-English mixed speech recognition #Low CER speech transcription #Multi-dialect support

Downloads 73

Release Time : 11/18/2024

Model Overview

This model is an optimized version of Whisper-large-v3, specifically fine-tuned for Cantonese and English mixed speech scenarios, suitable for tasks such as speech-to-text and real-time subtitle generation

Model Features

Cantonese-English mixed recognition

Specially optimized to handle mixed Cantonese and English speech content

High-performance transcription

Achieves a character error rate (CER) of 13.7% on mixed speech datasets

Large-scale training

Trained on Common Voice and specialized Cantonese datasets

Model Capabilities

Speech-to-text

Real-time subtitle generation

Bilingual mixed speech recognition

Use Cases

Media production

Cantonese program subtitle generation

Automatically generates subtitles for Cantonese programs containing English terms

Accurately recognizes mixed Cantonese-English content

Voice assistants

Bilingual voice command recognition

Recognizes user voice commands mixing Cantonese and English

Property	Details
Model Type	`openai/whisper-large-v3-turbo`
Training Data	`AlienKevin/mixed_cantonese_and_english_speech`, `mozilla-foundation/common_voice_17_0`, `mozilla-foundation/common_voice_11_0`
Metrics	CER: 13.7%

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Whisper Large V3 Turbo Cantonese Yue English

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Transformers

🚀 Quick Start

✨ Features

📦 Installation

📚 Documentation

Model Information

Training Arguments

Hardware

FAQ

📄 License