W

Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h With Lm

Developed by Lemswasabi
基于wav2vec 2.0大型XLSR-53检查点微调的卢森堡语语音识别模型,使用842小时未标注和14小时标注数据训练,并集成5-gram语言模型
Downloads 170
Release Time : 5/24/2022

Model Overview

该模型是一个针对卢森堡语的自动语音识别系统,通过大规模未标注数据和少量标注数据训练,结合语言模型提升识别准确率

Model Features

跨语言预训练
基于XLSR-53多语言模型进行微调,充分利用跨语言语音表征
语言模型集成
使用5-gram语言模型对输出进行重新评分,提高识别准确率
高效数据利用
结合842小时未标注数据和14小时标注数据进行训练

Model Capabilities

卢森堡语语音识别
音频转文本
语音转录

Use Cases

媒体转录
广播内容转录
转录RTL.lu等卢森堡语广播内容
词错误率9.3%-9.5%
语音助手
卢森堡语语音交互
为卢森堡语用户提供语音控制功能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase