S

Stt Kk Ru Fastconformer Hybrid Large

由 nvidia 开发
NVIDIA FastConformer-Hybrid Large (kk-ru) 是一个语音识别模型,可将哈萨克语和俄语语音转录为小写文本。
下载量 930
发布时间 : 9/10/2024

模型简介

该模型基于FastConformer Transducer - CTC架构,是混合模型,结合了Token - and - Duration Transducer和CTC两种损失函数进行训练,适用于哈萨克语和俄语的语音识别任务。

模型特点

多语言支持
支持哈萨克语和俄语的语音识别。
混合模型架构
结合了Token - and - Duration Transducer和CTC两种损失函数进行训练,提升模型性能。
高性能
在多个测试集上表现出色,字错误率(WER)较低。

模型能力

语音识别
多语言转录
非流式语音处理

使用案例

语音转录
哈萨克语语音转录
将哈萨克语语音转录为文本。
在KSC2测试集(朗读)上的WER为4.43%。
俄语语音转录
将俄语语音转录为文本。
在MCV12测试集上的WER为6.29%。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase