W

Wav2vec2hindia

由 SAGAR4REAL 开发
基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型
下载量 22
发布时间 : 3/28/2022

模型简介

该模型是针对印度语言的语音识别任务进行优化的版本,基于wav2vec2-xls-r-300m架构微调

模型特点

基于XLS-R架构
使用facebook的wav2vec2-xls-r-300m作为基础模型,具备强大的语音特征提取能力
印度语言优化
专门针对印度语言进行微调,可能提升相关语言的识别准确率
高效训练配置
采用混合精度训练和梯度累积等技术,优化训练效率

模型能力

语音识别
音频转文本
印度语言处理

使用案例

语音转录
印度语言语音转写
将印度语言的语音内容转换为文本
语音助手
印度语言语音交互
为印度语言用户提供语音交互能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase