W

Wav2vec2 Large Xls R 300m Hi Cv8 B2

由 DrishtiSharma 开发
这是一个基于Facebook的wav2vec2-xls-r-300m模型在印地语Common Voice 8.0数据集上微调的自动语音识别(ASR)模型。
下载量 22
发布时间 : 3/2/2022

模型简介

该模型专门用于印地语的自动语音识别任务,在Common Voice 8.0数据集上训练,取得了较低的词错误率(WER)。

模型特点

高性能印地语识别
在Common Voice 8.0印地语测试集上取得了38.9%的词错误率(WER)和13.0%的字错误率(CER)
基于XLS-R架构
使用Facebook的wav2vec2-XLS-R-300m作为基础模型,具有强大的语音特征提取能力
精细调优
经过35轮训练,使用线性学习率调度和预热策略优化模型性能

模型能力

印地语语音识别
语音转文本
鲁棒语音事件检测

使用案例

语音转录
印地语语音转文本
将印地语语音内容转换为文本
在测试集上达到38.9% WER
语音助手
印地语语音命令识别
识别和理解印地语语音命令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase