B

Bert Base Arabertv01

aubmindlabによって開発
BERTアーキテクチャに基づくアラビア語事前学習言語モデル、様々なアラビア語NLPタスクに対応
ダウンロード数 293
リリース時間 : 3/2/2022

モデル概要

AraBERTはGoogleのBERTアーキテクチャに基づくアラビア語事前学習言語モデルで、アラビア語自然言語理解タスクのために特別に設計されています。モデルにはv0.1とv1の2つのバージョンがあり、主な違いはv1バージョンがFarasa形態素解析器を使用してテキストの接頭辞/接尾辞分割前処理を行う点です。

モデル特徴

アラビア語最適化
アラビア語の特性に特化して最適化されており、文字セットや形態素解析処理を含む
マルチバージョンサポート
v0.1とv1の2つのバージョンを提供し、v1版はFarasa形態素解析器を使用してより詳細な前処理を行う
大規模事前学習
7700万文/23GB/27億語のアラビア語コーパスに基づいて訓練

モデル能力

テキストマスク予測
感情分析
固有表現認識
質問応答システム

使用事例

感情分析
アラビア語ソーシャルメディア感情分析
アラビア語ソーシャルメディア投稿の感情傾向を分析
HARD、ASTD-Balancedなど6つのアラビア語感情分析データセットで優れた性能を発揮
情報抽出
アラビア語固有表現認識
アラビア語テキスト中の人名、地名などの実体を認識
ANERcorpデータセットで良好な性能を示す
質問応答システム
アラビア語質問応答
アラビア語質問応答システムを構築
Arabic-SQuADとARCDデータセットで良好な性能を示す
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase