V

Vakyansh Wav2vec2 Hindi Him 4200

由 Harveenchadha 开发
基于Wav2Vec2架构的印地语自动语音识别模型,由Harveen Chadha开发,在4200小时标注印地语数据上微调
下载量 2,621
发布时间 : 3/2/2022

模型简介

该模型是一个针对印地语优化的自动语音识别(ASR)系统,基于Facebook的Wav2Vec2架构,在CLSRIL-23多语言预训练模型基础上微调而成。

模型特点

大规模印地语数据训练
基于4200小时的标注印地语数据进行微调
多语言预训练基础
基于CLSRIL-23多语言预训练模型进行微调
无需语言模型
可直接使用原始模型进行推理,无需额外语言模型

模型能力

印地语语音识别
16kHz音频处理

使用案例

语音转写
印地语语音转文本
将印地语语音内容转换为文本
在Common Voice印地语测试集上WER为33.17%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase