8

84rry Xls R 300M AR

由 84rry 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice数据集上微调的阿拉伯语语音识别模型,在评估集上取得了0.5078的词错误率。
下载量 27
发布时间 : 6/9/2022

模型简介

这是一个用于阿拉伯语语音识别的微调模型,基于Facebook的wav2vec2-xls-r-300m架构,在Common Voice数据集上训练。

模型特点

基于XLS-R架构
使用Facebook的大规模跨语言语音表示学习架构XLS-R,具有强大的语音特征提取能力。
阿拉伯语优化
专门针对阿拉伯语语音进行了微调优化,在Common Voice数据集上表现良好。
中等规模模型
300M参数规模,在性能和计算资源需求之间取得平衡。

模型能力

阿拉伯语语音识别
语音转文本
音频内容转录

使用案例

语音转录
阿拉伯语语音转文字
将阿拉伯语语音内容转换为文本格式
词错误率0.5078
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手或控制系统的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase