W

Wav2vec2 Large Xlsr 53 Hungarian

由 jonatasgrosman 开发
这是一个针对匈牙利语语音识别任务微调的XLSR-53大模型,基于Common Voice和CSS10数据集训练。
下载量 127.73k
发布时间 : 3/2/2022

模型简介

该模型是基于facebook/wav2vec2-large-xlsr-53在匈牙利语上微调的自动语音识别(ASR)模型,支持16kHz采样率的语音输入。

模型特点

高性能匈牙利语识别
在Common Voice匈牙利语测试集上达到31.40% WER和6.20% CER,优于同类模型
基于XLSR-53架构
利用跨语言语音表示学习的大规模预训练模型进行微调
无需语言模型
可以直接使用,不需要额外的语言模型支持

模型能力

匈牙利语语音识别
16kHz音频处理

使用案例

语音转文字
语音转录
将匈牙利语语音内容转换为文字
准确率约93.8%(基于CER)
语音助手
匈牙利语语音指令识别
用于匈牙利语语音助手的前端语音识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase