W

Whisper Base Arabic

由 YazanSalameh 开发
基于Whisper-base的阿拉伯语语音识别模型,在多个阿拉伯语数据集上微调,专注于阿拉伯语语音转文本任务
下载量 46
发布时间 : 1/18/2024

模型简介

这是一个针对阿拉伯语优化的自动语音识别(ASR)模型,基于OpenAI的Whisper-base架构,支持阿拉伯语语音转录为文本

模型特点

阿拉伯语优化
专门针对阿拉伯语语音特点进行优化训练,移除了阿拉伯语变音符号以提高识别准确率
多数据集训练
结合了Common Voice、MGB2和约旦音频数据集进行训练,覆盖多种阿拉伯语方言和口音
高效训练
采用梯度累积和线性学习率调度等优化技术,在有限资源下实现高效训练

模型能力

阿拉伯语语音识别
语音转文本
音频转录

使用案例

语音转录
会议记录
将阿拉伯语会议录音自动转录为文字记录
词错误率34.7%
媒体字幕生成
为阿拉伯语视频内容自动生成字幕
语音助手
阿拉伯语语音指令识别
用于阿拉伯语语音助手和智能家居控制
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase