B

Bert Medium Arabic

由asafaya開發
預訓練的阿拉伯語BERT中型語言模型,基於約82億詞的阿拉伯語文本資源訓練
下載量 66
發布時間 : 3/2/2022

模型概述

該模型是一個預訓練的阿拉伯語BERT中型語言模型,主要用於自然語言處理任務,如文本分類、命名實體識別等。

模型特點

多源訓練數據
基於OSCAR阿拉伯語版和維基百科等多源阿拉伯語文本資源訓練,總計約95GB。
方言支持
不僅包含現代標準阿拉伯語,也包含部分方言阿拉伯語。
優化訓練
訓練參數調整:總步數300萬(batch size=128),而非原版BERT的100萬步(batch size=256)。

模型能力

文本分類
命名實體識別
文本生成
語言理解

使用案例

社交媒體分析
冒犯性言論識別
用於識別社交媒體上的冒犯性言論。
在SemEval-2020任務12中表現良好。
自然語言處理
文本分類
用於阿拉伯語文本的分類任務。
命名實體識別
用於識別阿拉伯語文本中的命名實體。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase