W

Wav2vec2 Large Xlsr 53 Kalmyk

由 tugstugi 开发
这是一个基于Wav2Vec2架构的卡尔梅克语自动语音识别模型,经过预训练和微调,支持卡尔梅克语语音转文本任务。
下载量 79
发布时间 : 3/2/2022

模型简介

该模型最初在500小时卡尔梅克电视录音和1000小时蒙古语语音数据集上预训练,后通过300小时卡尔梅克合成语音数据集微调,适用于卡尔梅克语语音识别。

模型特点

多阶段训练
先在大量卡尔梅克和蒙古语数据上预训练,再通过合成语音数据微调,提升识别效果。
合成数据增强
使用300小时卡尔梅克合成语音数据进行微调,增强模型对卡尔梅克语的识别能力。
跨语言迁移
利用蒙古语数据进行预训练,可能有助于提升相关语言的识别效果。

模型能力

卡尔梅克语语音识别
语音转文本

使用案例

语音转录
卡尔梅克电视节目转录
将卡尔梅克电视节目内容自动转录为文本
在私有测试集上词错误率(WER)为50%
清晰语音识别
对发音清晰的卡尔梅克语进行识别
词错误率应显著低于50%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase