X

Xlsr 53 Wav2vec Hi

由 harshit345 开发
基于facebook/wav2vec2-large-xlsr-53微调的印地语语音识别模型,在低资源印度语言的多语言和语码转换ASR挑战赛数据上训练
下载量 38
发布时间 : 3/2/2022

模型简介

这是一个用于印地语自动语音识别(ASR)的模型,基于XLSR-53架构微调,支持16kHz采样率的语音输入。

模型特点

低资源语言优化
专门针对印地语等低资源印度语言进行优化训练
无需语言模型
可以直接使用而无需额外的语言模型支持
16kHz采样率支持
专为16kHz采样率的语音输入设计

模型能力

印地语语音识别
语音转文本
自动语音识别

使用案例

语音转录
印地语语音转录
将印地语语音内容转换为文本
在Common Voice印地语测试集上达到20.22%的词错误率
语音助手
印地语语音命令识别
用于构建支持印地语的语音助手系统
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase