B

Bert Large Arabertv02 Twitter

由aubmindlab開發
AraBERTv0.2-Twitter是針對阿拉伯語方言及推文優化的預訓練語言模型,基於BERT架構開發,新增表情符號和常見詞彙支持。
下載量 312
發布時間 : 3/2/2022

模型概述

該模型通過在約6000萬條阿拉伯語推文上繼續預訓練而得,專門優化了阿拉伯語方言和社交媒體文本的理解能力。

模型特點

方言優化
專門針對阿拉伯語方言和推文內容進行優化訓練
表情符號支持
詞彙表中新增了表情符號及常見社交媒體詞彙
短文本優化
針對64個token的序列長度進行訓練,適合社交媒體短文本

模型能力

阿拉伯語文本理解
社交媒體文本處理
掩碼語言預測

使用案例

社交媒體分析
阿拉伯語推文情感分析
分析阿拉伯語推文中的情感傾向
方言文本理解
處理阿拉伯語不同地區的方言文本
語言模型應用
文本補全
預測被掩碼的詞語或短語
示例:'黎巴嫩的首都是[MASK]'可預測為'貝魯特'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase