S

Stt Ru Conformer Transducer Large

由 nvidia 开发
这是一个基于Conformer架构的非自回归大型俄语语音识别模型,参数约1.2亿,训练数据约1636小时俄语语音。
下载量 537
发布时间 : 10/24/2022

模型简介

该模型能够将俄语语音转录为包含空格的小写西里尔字母,适用于俄语语音识别任务。

模型特点

多数据集训练
在多个俄语语音数据集上进行训练,包括Mozilla Common Voice 10.0、SberDevices/Golos、Russian-LibriSpeech和SOVA-Dataset等。
非自回归架构
采用Conformer的非自回归'大型'变体,约有1.2亿个参数。
易于使用
可在NeMo工具包中使用,支持自动实例化模型和转录语音。

模型能力

俄语语音识别
音频转录
语音转文本

使用案例

语音转录
俄语语音转录
将俄语语音转换为文本
准确率较高,在MCV 10.0测试集上WER为4.0%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase