B

Bert Large Arabertv2

aubmindlabによって開発
AraBERTは、グーグルのBERTアーキテクチャに基づくアラビア語の事前学習言語モデルで、アラビア語の自然言語理解タスク用に設計されています。
ダウンロード数 334
リリース時間 : 3/2/2022

モデル概要

AraBERTは、アラビア語用に最適化されたBERTモデルで、前処理の改善とより大規模なデータでの学習により、アラビア語のNLPタスクでの性能が向上しています。

モデル特徴

改善された前処理
句読点や数字が単語にくっつく問題を解決し、空白を挿入することで形態素解析の結果を最適化しました。
より大規模なデータでの学習
約3.5倍のデータ量(ウィキペディア、OSCARコーパスなど)を使用して、モデルの性能を向上させました。
複数バージョンのサポート
baseとlargeバージョン、およびTwitterデータ向けのバリエーションを提供し、さまざまなニーズに対応します。

モデル能力

アラビア語テキスト理解
感情分析
固有表現抽出
質問応答システム

使用事例

感情分析
ソーシャルメディアの感情分析
アラビア語のソーシャルメディアの内容の感情傾向を分析します。
HARD、ASTD-Balancedなどのデータセットで優れた結果を示しました。
固有表現抽出
ニュースの固有表現抽出
アラビア語のニュースから固有表現を抽出します。
ANERcorpデータセットに基づいて評価されました。
質問応答システム
アラビア語の質問応答
アラビア語のテキストに基づく質問に回答します。
Arabic-SQuADとARCDデータセットで評価されました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase