B

Bert Base Arabertv01

Developed by aubmindlab
BERTアーキテクチャに基づくアラビア語事前学習言語モデル、様々なアラビア語NLPタスクに対応
Downloads 293
Release Time : 3/2/2022

Model Overview

AraBERTはGoogleのBERTアーキテクチャに基づくアラビア語事前学習言語モデルで、アラビア語自然言語理解タスクのために特別に設計されています。モデルにはv0.1とv1の2つのバージョンがあり、主な違いはv1バージョンがFarasa形態素解析器を使用してテキストの接頭辞/接尾辞分割前処理を行う点です。

Model Features

アラビア語最適化
アラビア語の特性に特化して最適化されており、文字セットや形態素解析処理を含む
マルチバージョンサポート
v0.1とv1の2つのバージョンを提供し、v1版はFarasa形態素解析器を使用してより詳細な前処理を行う
大規模事前学習
7700万文/23GB/27億語のアラビア語コーパスに基づいて訓練

Model Capabilities

テキストマスク予測
感情分析
固有表現認識
質問応答システム

Use Cases

感情分析
アラビア語ソーシャルメディア感情分析
アラビア語ソーシャルメディア投稿の感情傾向を分析
HARD、ASTD-Balancedなど6つのアラビア語感情分析データセットで優れた性能を発揮
情報抽出
アラビア語固有表現認識
アラビア語テキスト中の人名、地名などの実体を認識
ANERcorpデータセットで良好な性能を示す
質問応答システム
アラビア語質問応答
アラビア語質問応答システムを構築
Arabic-SQuADとARCDデータセットで良好な性能を示す
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase