W

Wav2vec2 Large Xlsr Hindi

由 skylord 开发
基于facebook/wav2vec2-large-xlsr-53微调的印地语语音识别模型,支持16kHz采样率的语音输入
下载量 82
发布时间 : 3/2/2022

模型简介

该模型是专为印地语优化的自动语音识别(ASR)系统,通过多个印地语数据集微调训练,可直接用于语音转文本任务

模型特点

多数据集微调
使用通用语音、印度语TTS和IIITH语音库三个印地语数据集进行训练
无需语言模型
可直接使用,无需额外语言模型支持
均衡数据分布
训练数据在性别和口音方面分布均衡(除通用语音数据集偏向男性声音)

模型能力

印地语语音识别
16kHz采样率语音处理
端到端语音转文本

使用案例

语音转录
印地语语音转文字
将印地语语音内容转换为文本
在自定义数据集上达到17.23% WER
语音助手
印地语语音指令识别
用于印地语语音助手系统的语音指令理解
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase