S

Stt Rw Conformer Transducer Large

由 nvidia 开发
这是一个用于卢旺达语语音识别的Conformer-Transducer大型模型,能将语音转录为小写拉丁字母,支持空格和撇号。
下载量 116
发布时间 : 7/31/2022

模型简介

本模型用于将语音转录为包含空格和撇号的小写拉丁字母,在约2000小时的卢旺达语语音数据上进行训练。

模型特点

高准确度转录
可将语音准确转录为小写拉丁字母,支持空格和撇号。
大型模型架构
基于Conformer的非自回归'大型'变体,参数约1.2亿,性能强大。
易用性
可在NeMo工具包中使用,方便进行推理和微调。

模型能力

语音识别
语音转录
支持卢旺达语

使用案例

语音转录
音频文件转录
将卢旺达语语音文件转录为文本
准确率较高,测试集WER为16.19%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase