W

Wav2vec2 Large Xls R 300m Arabic

由 phantomcoder1996 开发
这是一个针对现代标准阿拉伯语微调的wav2vec2-large-xlsr-300m模型,专注于自动语音识别任务。
下载量 23
发布时间 : 3/2/2022

模型简介

该模型基于wav2vec2架构,专门针对阿拉伯语语音识别进行了优化,适用于将阿拉伯语语音转换为文本的应用场景。

模型特点

阿拉伯语优化
专门针对现代标准阿拉伯语进行微调,提高了阿拉伯语语音识别的准确性。
大规模预训练
基于300百万参数的大规模XLS-R模型,具有较强的语音特征提取能力。
多数据集评估
在Common Voice 7.0和鲁棒语音赛事数据集上进行了全面评估。

模型能力

阿拉伯语语音识别
语音转文本
自动语音转录

使用案例

语音转录
阿拉伯语语音转文字
将阿拉伯语语音内容自动转换为文字记录
在Common Voice 7.0测试集上词错误率为57.8
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手或控制系统的语音指令识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase