B

Bert Large Arabic

Developed by asafaya
针对阿拉伯语的预训练BERT大型语言模型,支持现代标准阿拉伯语和部分方言
Downloads 278
Release Time : 3/2/2022

Model Overview

这是一个基于BERT架构的大型阿拉伯语预训练语言模型,专门针对阿拉伯语文本处理任务进行优化,适用于多种自然语言处理应用。

Model Features

大规模预训练
基于82亿词的阿拉伯语语料训练,包含OSCAR和维基百科数据
方言支持
不仅支持现代标准阿拉伯语,还包含部分阿拉伯语方言内容
优化训练
调整原始BERT训练参数,增加训练步数至300万步

Model Capabilities

文本表示学习
掩码语言建模
阿拉伯语文本理解
命名实体识别

Use Cases

社交媒体分析
冒犯言论识别
用于识别阿拉伯语社交媒体中的冒犯性内容
在SemEval-2020任务12中取得良好表现
文本分类
阿拉伯语文本分类
可用于新闻分类、情感分析等任务
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase