W

Wav2vec2 Large Xlsr 53 Arabic

由 elgeish 开发
基于facebook/wav2vec2-large-xlsr-53微调的阿拉伯语自动语音识别模型,支持16kHz采样率的语音输入
下载量 994
发布时间 : 3/2/2022

模型简介

该模型是针对阿拉伯语优化的自动语音识别系统,采用XLSR架构,在Common Voice和阿拉伯语音语料库上微调训练

模型特点

阿拉伯语优化
专门针对阿拉伯语语音特点进行微调,使用巴克瓦尔特转写系统处理阿拉伯文本
两阶段训练
先在阿拉伯语音语料库预训练,再在Common Voice数据集上微调,优化识别效果
无需语言模型
可直接使用,无需额外语言模型支持

模型能力

阿拉伯语语音识别
16kHz采样率音频处理
自动转写阿拉伯语语音

使用案例

语音转写
阿拉伯语语音转文本
将阿拉伯语语音内容自动转写为文本
在Common Voice测试集上达到26.55% WER
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手系统的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase