S

Stt Ru Conformer Transducer Large

Developed by nvidia
这是一个基于Conformer架构的非自回归大型俄语语音识别模型,参数约1.2亿,训练数据约1636小时俄语语音。
Downloads 537
Release Time : 10/24/2022

Model Overview

该模型能够将俄语语音转录为包含空格的小写西里尔字母,适用于俄语语音识别任务。

Model Features

多数据集训练
在多个俄语语音数据集上进行训练,包括Mozilla Common Voice 10.0、SberDevices/Golos、Russian-LibriSpeech和SOVA-Dataset等。
非自回归架构
采用Conformer的非自回归'大型'变体,约有1.2亿个参数。
易于使用
可在NeMo工具包中使用,支持自动实例化模型和转录语音。

Model Capabilities

俄语语音识别
音频转录
语音转文本

Use Cases

语音转录
俄语语音转录
将俄语语音转换为文本
准确率较高,在MCV 10.0测试集上WER为4.0%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase