S

Stt Zh Conformer Transducer Large

由 nvidia 开发
这是一个用于转录普通话语音的大型Conformer-Transducer模型,参数约1.2亿,在AISHELL-2数据集上训练。
下载量 72
发布时间 : 6/29/2022

模型简介

该模型是一个基于Conformer-Transducer架构的自动语音识别模型,专门用于处理普通话语音转录任务。

模型特点

高性能转录
在AISHELL-2测试集上实现了5.3-5.7%的字符错误率(CER)
大规模训练
使用约1.2亿参数的大型模型架构,提供更准确的转录结果
普通话优化
专门针对普通话语音进行训练和优化

模型能力

普通话语音识别
音频转录
语音转文本

使用案例

语音转录
会议记录
将普通话会议录音自动转录为文字记录
准确率约94.3-94.7%
语音助手
为普通话语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase