wav2vec2-large-xls-r-300m-ru Open-source Russian Speech Recognition Model - Precise Transcription with Low Error Rate

Wav2vec2 Large Xls R 300m Ru

Developed by NLPVladimir

This model is a Russian automatic speech recognition (ASR) model fine-tuned on the common_voice_17_0 dataset based on facebook/wav2vec2-xls-r-300m, with a word error rate (WER) of 0.195.

Speech Recognition

Transformers

Open Source License:Apache-2.0 #Russian speech recognition #Low word error rate #Multilingual transfer learning

Downloads 56

Release Time : 1/30/2025

Model Overview

This is a model for Russian automatic speech recognition, based on the wav2vec2 architecture and fine-tuned on the Common Voice dataset.

Model Features

Low word error rate

Achieves a word error rate (WER) of 0.195 on the Common Voice Russian test set

Based on large-scale pretrained model

Fine-tuned from the facebook/wav2vec2-xls-r-300m pretrained model

Efficient training

Optimized training efficiency using mixed precision training and gradient accumulation techniques

Model Capabilities

Russian speech recognition

Speech-to-text

Audio content analysis

Use Cases

Speech transcription

Russian speech transcription

Convert Russian speech to text

Word error rate 0.195

Voice assistants

Russian voice command recognition

Basic recognition capability for Russian voice assistants

Property	Details
Library Name	transformers
License	apache - 2.0
Base Model	facebook/wav2vec2-xls-r-300m
Tags	generated_from_trainer
Datasets	common_voice_17_0
Metrics	wer

Training Loss	Epoch	Step	Validation Loss	Wer
4.6582	1.2287	500	0.8055	0.7838
0.4342	2.4575	1000	0.3085	0.3492
0.2572	3.6862	1500	0.2439	0.2692
0.1731	4.9149	2000	0.2070	0.2266
0.1178	6.1426	2500	0.1965	0.1950

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Large Xls R 300m Ru

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 wav2vec2-large-xls-r-300m-ru

🚀 Quick Start

📚 Documentation

Model Information

Model Index

Training Procedure

Training Hyperparameters

Training Results

Framework Versions