S

Stt De Conformer Ctc Large

由 nvidia 开发
这是一个用于德语自动语音识别的大规模Conformer-CTC模型,由NVIDIA训练并在数千小时的德语语音数据上进行优化。
下载量 132
发布时间 : 6/28/2022

模型简介

该模型能够转录德语语音为小写字母文本(包括空格),采用Conformer架构的非自回归变体,具有约1.2亿参数。

模型特点

大规模训练数据
在数千小时的德语语音数据上训练,包括VoxPopuli、多语言LibriSpeech和Mozilla Common Voice数据集。
高性能
在多个测试集上表现出色,如Common Voice 7测试集的WER为6.68%。
Riva兼容
与NVIDIA Riva兼容,可用于生产级服务器部署。
非自回归架构
采用Conformer的非自回归变体,使用CTC损失/解码,适合高效语音识别。

模型能力

德语语音识别
音频转录
支持16kHz单声道音频输入

使用案例

语音转录
会议记录
将德语会议录音自动转录为文字记录
高准确率的转录文本
语音助手
为德语语音助手提供语音识别能力
实时准确的语音转文字
媒体处理
字幕生成
为德语视频内容自动生成字幕
高效准确的同步字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase