B

Bert Base Arabert

由aubmindlab開發
AraBERT是基於谷歌BERT架構的阿拉伯語預訓練語言模型,專為阿拉伯語自然語言理解任務設計。
下載量 74.71k
發布時間 : 3/2/2022

模型概述

AraBERT是為阿拉伯語優化的BERT模型,支持多種下游NLP任務,包括情感分析、命名實體識別和問答系統。

模型特點

阿拉伯語優化
專門針對阿拉伯語特性進行預訓練,包括處理前綴和後綴分離。
Farasa分詞
使用Farasa分詞器進行預分割,提高阿拉伯語文本處理效果。
多任務支持
支持多種下游NLP任務,包括情感分析、NER和問答系統。
大規模預訓練
使用77GB阿拉伯語語料庫進行預訓練,包含約2.7B詞彙。

模型能力

阿拉伯語文本理解
情感分析
命名實體識別
問答系統
文本分類

使用案例

情感分析
阿拉伯社交媒體情感分析
分析阿拉伯語社交媒體帖子的情感傾向
在HARD、ASTD等多個阿拉伯情感分析數據集上表現優異
信息提取
阿拉伯語命名實體識別
從阿拉伯文本中識別人名、地名等實體
在ANERcorp數據集上表現良好
問答系統
阿拉伯語問答
構建阿拉伯語問答系統
在Arabic-SQuAD和ARCD數據集上有競爭力表現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase