W

Wav2vec2 Xls R 300m Demo Colab

由 Mahalakshmi 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的语音识别模型
下载量 16
发布时间 : 3/2/2022

模型简介

用于语音识别任务的微调模型,基于wav2vec2-xls-r-300m架构,在common_voice数据集上进行训练

模型特点

高效微调
基于预训练的wav2vec2-xls-r-300m模型进行微调,在common_voice数据集上取得了良好的效果
良好性能
在评估集上取得了1.0377的词错误率,表现优异
快速推理
每秒可处理25.239个样本,推理速度较快

模型能力

语音识别
音频转文本

使用案例

语音转录
语音转文字
将语音内容转换为文字记录
词错误率1.0377
语音助手
语音指令识别
识别用户语音指令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase