GigaBERT-v4-アラビア語と英語オープンソースモデル - 無料でデプロイし、英語とアラビア語の情報抽出のゼロショット移行情報抽出能力を向上させる

ホーム

Gigabert V4 Arabic And English

lanwuweiによって開発

GigaBERT-v4はGigaBERT-v3をコード混合データでさらに事前学習したモデルで、情報抽出（IE）タスクにおいて英語からアラビア語へのゼロショット転移性能の向上を示しています。

大規模言語モデル #アラビア語-英語混合 #ゼロショット転移 #情報抽出最適化

ダウンロード数 24

リリース時間 : 3/2/2022

モデル概要

GigaBERT-v4は英語とアラビア語の情報抽出タスクに特化した事前学習言語モデルで、コード混合データによりゼロショット転移能力を強化しています。

モデル特徴

ゼロショット転移学習

英語からアラビア語の情報抽出タスクで優れたゼロショット転移性能を示します。

コード混合データ事前学習

GigaBERT-v3をベースにコード混合データで継続事前学習を行い、多言語処理能力を強化しました。

モデル能力

英語情報抽出

アラビア語情報抽出

クロスランゲージゼロショット転移

使用事例

情報抽出

クロスランゲージ固有表現認識

英語で学習後、アラビア語テキストの固有表現認識タスクに直接適用

ゼロショット転移性能向上

関係抽出

英語とアラビア語テキストからエンティティ間の関係を抽出

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Gigabert V4 Arabic And English

モデル概要

モデル特徴

モデル能力

使用事例

🚀 GigaBERT-v4

🚀 クイックスタート

💻 使用例

基本的な使用法