B

Bert Large Arabertv2

由aubmindlab開發
AraBERT是基於谷歌BERT架構的阿拉伯語預訓練語言模型,專為阿拉伯語自然語言理解任務設計。
下載量 334
發布時間 : 3/2/2022

模型概述

AraBERT是一個針對阿拉伯語優化的BERT模型,通過改進預處理和更大規模的數據訓練,提升了在阿拉伯語NLP任務中的表現。

模型特點

改進的預處理
解決了標點符號和數字與單詞粘連的問題,通過插入空格優化了分詞效果。
更大規模的數據訓練
使用了約3.5倍的數據量,包括維基百科、OSCAR語料庫等,提升了模型性能。
多版本支持
提供base和large版本,以及針對Twitter數據的變體,滿足不同需求。

模型能力

阿拉伯語文本理解
情感分析
命名實體識別
問答系統

使用案例

情感分析
社交媒體情感分析
分析阿拉伯語社交媒體內容的情感傾向。
在HARD、ASTD-Balanced等數據集上表現優異。
命名實體識別
新聞實體識別
從阿拉伯語新聞中識別命名實體。
基於ANERcorp數據集評估。
問答系統
阿拉伯語問答
回答基於阿拉伯語文本的問題。
在Arabic-SQuAD和ARCD數據集上評估。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase