W

Wav2vec2 Xlsr 1b Ru

由 RASMUS 开发
基于facebook/wav2vec2-xls-r-1b在Common Voice数据集上微调的俄语自动语音识别模型
下载量 41
发布时间 : 3/2/2022

模型简介

该模型是针对俄语优化的自动语音识别(ASR)模型,基于10亿参数的XLS-R架构,在Common Voice 8俄语数据集上微调,能够将俄语语音转换为文本。

模型特点

大规模预训练架构
基于10亿参数的XLS-R架构,具备强大的语音特征提取能力
俄语优化
专门针对俄语语音特点进行微调,适应俄语发音和语法特征
多数据集验证
在Common Voice和鲁棒语音事件等多个数据集上验证性能

模型能力

俄语语音识别
语音转文本
自动语音转录

使用案例

语音转录
俄语语音转文字
将俄语语音内容转换为可编辑的文本格式
在Common Voice测试集上WER为10.83%
语音助手
俄语语音指令识别
用于俄语语音助手和智能家居设备的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase