W

Wav2vec2 Large Xlsr Hindi

由 theainerd 开发
基于facebook/wav2vec2-large-xlsr-53在低资源印度语言数据集上微调的印地语自动语音识别模型
下载量 1.6M
发布时间 : 3/2/2022

模型简介

该模型是一个针对印地语优化的自动语音识别(ASR)模型,支持16kHz采样率的语音输入,可直接用于语音转文本任务而无需语言模型。

模型特点

低资源语言优化
专门针对低资源印度语言环境进行微调,适合印地语语音识别
无需语言模型
可直接使用而无需额外语言模型支持
16kHz采样率支持
支持标准16kHz采样率的语音输入

模型能力

印地语语音识别
语音转文本
自动语音识别

使用案例

语音转录
印地语语音转录
将印地语语音内容转换为文本
在Common Voice印地语测试集上达到72.62%词错误率
语音助手
印地语语音指令识别
用于印地语语音助手系统的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase