S

Stt Uz Fastconformer Hybrid Large Pc

由 nvidia 开发
这是一个基于FastConformer架构的大型乌兹别克语语音识别模型,支持Transducer和CTC双重解码,在多个测试集上表现出色。
下载量 96
发布时间 : 10/31/2024

模型简介

该模型用于乌兹别克语语音识别,能够转写包含大小写字母、空格和常见标点的文本,适用于通用语音识别场景。

模型特点

双重解码机制
同时支持Transducer和CTC两种解码方式,提供更灵活的推理选项
高效架构
采用优化的FastConformer架构,相比标准Conformer具有更高的计算效率
多数据集训练
基于1000小时的乌兹别克语语音数据训练,覆盖多种语音场景

模型能力

乌兹别克语语音识别
音频转文本
批量语音处理

使用案例

语音转写
会议记录
将乌兹别克语会议录音自动转写为文字记录
在通用场景下WER约16-17%
语音助手
为乌兹别克语语音助手提供语音识别能力
教育
语言学习
帮助乌兹别克语学习者检查发音准确性
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase