W

Wav2vec2 Xls R 300m Hi Final

由 LegolasTheElf 开发
基于facebook/wav2vec2-xls-r-300m微调的印地语语音识别模型,在Openslr多语言语料库和Common Voice 7.0数据集上训练
下载量 14
发布时间 : 3/2/2022

模型简介

这是一个针对印地语优化的自动语音识别(ASR)模型,适用于将印地语语音转换为文本的任务

模型特点

多数据集训练
结合Openslr多语言语料库和Common Voice 7.0数据集进行训练,提高模型泛化能力
低错误率
在评估集上达到31.37%的词错误率(WER)和9.72%的字错误率(CER)
高效训练
采用混合精度训练和梯度累积技术优化训练效率

模型能力

印地语语音识别
语音转文本
长音频处理

使用案例

语音转录
印地语语音转写
将印地语语音内容转换为文字
在测试集上达到31.37%的词错误率
语音助手
印地语语音指令识别
用于支持印地语的语音助手系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase