Whisper Medium Open-Source Speech Recognition Model - Free Support for Multilingual Automatic Speech Recognition

Whisper Medium

Developed by Xenova

Whisper Medium is a medium-scale speech recognition model developed by OpenAI, supporting automatic speech recognition (ASR) tasks in multiple languages.

Speech Recognition

Transformers

#Speech-to-Text #Multilingual Support #Web Adaptation

Downloads 871

Release Time : 5/31/2023

Model Overview

Whisper Medium is a Transformer-based speech recognition model capable of converting speech to text with support for multiple languages.

Model Features

Multilingual Support

Supports speech recognition in multiple languages, suitable for international applications.

High Accuracy

Based on the Transformer architecture, it provides high-precision speech-to-text capabilities.

ONNX Compatibility

Supports the ONNX format, facilitating deployment on web and other platforms.

Model Capabilities

Speech Recognition

Multilingual Transcription

Real-time Speech-to-Text

Use Cases

Speech Transcription

Meeting Minutes

Automatically converts meeting recordings into text records for easy reference and analysis.

High-precision transcription with support for multilingual meetings.

Subtitle Generation

Automatically generates subtitles for video content, enhancing accessibility.

Supports subtitle generation in multiple languages.

Voice Assistants

Voice Input

Provides speech-to-text functionality for voice assistants, enabling natural language interaction.

Low-latency, high-precision speech recognition.

Property	Details
Base Model	openai/whisper-medium
Library Name	transformers.js

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Whisper Medium

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 Whisper-Medium ONNX for Transformers.js

🚀 Quick Start