B

Bert Base Arabertv02

aubmindlabによって開発
AraBERTはBERTアーキテクチャに基づくアラビア語の事前学習言語モデルで、アラビア語理解タスクに特化して最適化されています。
ダウンロード数 666.17k
リリース時間 : 3/2/2022

モデル概要

AraBERTはアラビア語用に設計された事前学習言語モデルで、BERTアーキテクチャに基づいており、感情分析、固有表現認識、質問応答システムなど、様々なアラビア語NLPタスクで優れた性能を発揮します。

モデル特徴

アラビア語最適化
アラビア語の特性に合わせて最適化されており、アラビア語特有の接頭辞と接尾辞の形態素解析問題の処理を含みます。
事前セグメント化処理
Farasa形態素解析器を使用してテキストを事前セグメント化処理し、モデルの理解能力を向上させます。
大規模訓練データ
2億を超える文(86億語)のアラビア語データを使用して訓練されています。
多バージョン対応
基本版と大型版、およびTwitterデータ向けの特別版を提供します。

モデル能力

アラビア語テキスト理解
感情分析
固有表現認識
質問応答システム
テキスト埋め込み

使用事例

感情分析
アラビア語コメントの感情分析
アラビア語のソーシャルメディアコメントや製品レビューの感情傾向を分析します。
複数のアラビア語感情分析データセットでmBERTよりも優れた性能を発揮します。
固有表現認識
アラビア語テキストの固有表現認識
アラビア語テキスト中の人名、地名などの固有表現を認識します。
ANERcorpデータセットで良好な結果を得ています。
質問応答システム
アラビア語の読解
アラビア語の記事に基づく質問に回答します。
Arabic - SQuADとARCDデータセットで良好な性能を発揮します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase