B

Bert Base Arabertv02 Twitter

由aubmindlab開發
針對阿拉伯語方言及推文優化的BERT模型,在6000萬條阿拉伯語推文上進行了MLM任務預訓練,新增表情符號和常用詞彙支持。
下載量 2,148
發布時間 : 3/2/2022

模型概述

基於谷歌BERT架構的阿拉伯語預訓練模型,特別優化了阿拉伯語方言和社交媒體文本處理能力。

模型特點

推文優化
專門在6000萬條多方言阿拉伯語推文上訓練,優化社交媒體文本處理
擴展詞彙表
新增表情符號和原先缺失的常用詞彙支持
短文本優化
預訓練時單句最大長度設為64,特別適合短文本處理

模型能力

阿拉伯語文本理解
社交媒體文本分析
掩碼詞預測
方言處理

使用案例

社交媒體分析
阿拉伯語推文情感分析
分析阿拉伯語用戶的推文情感傾向
方言內容理解
處理阿拉伯語各地方言的社交媒體內容
文本補全
阿拉伯語文本自動補全
預測被掩碼的阿拉伯語詞彙
如能準確預測'黎巴嫩的首都是[MASK]'中的'貝魯特'
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase