A

Asr Wav2vec2 Dvoice Darija

Developed by speechbrain
这是一个针对摩洛哥阿拉伯语方言(Darija)的自动语音识别模型,基于wav2vec 2.0架构在DVoice数据集上微调训练而成。
Downloads 120
Release Time : 6/9/2022

Model Overview

该模型提供端到端的Darija语音转录功能,采用预训练的wav2vec 2.0模型作为基础,叠加DNN层并在Darija数据集上微调,最终通过CTC贪婪解码器输出文本结果。

Model Features

低资源语言支持
专门针对资源稀缺的Darija方言优化,通过迁移学习技术解决数据不足问题
社区驱动数据
基于DVoice平台收集的真实社区录音数据训练,反映实际语言使用场景
高效微调架构
在预训练的wav2vec2-large-xlsr-53模型基础上,仅添加两层DNN进行微调,实现高效训练

Model Capabilities

摩洛哥阿拉伯语方言语音识别
16kHz单声道音频处理
自动音频标准化(重采样/单声道选择)

Use Cases

语音转录
方言媒体内容转录
将摩洛哥方言的播客、视频等内容自动转为文字
测试集WER 18.28%,CER 5.85%
语音助手
方言语音指令识别
为摩洛哥地区用户提供方言交互的语音助手
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase