multilingual-e5-base-xnliオープンソースモデル - 無料でデプロイ可能な多言語ゼロショット分類タスクをサポート

ホーム

Multilingual E5 Base Xnli

mjwongによって開発

このモデルはXNLIデータセットでmultilingual-e5-baseをファインチューニングしたバージョンで、多言語ゼロショット分類タスクをサポートします。

テキスト分類

Transformers

複数言語対応オープンソースライセンス:MIT #多言語ゼロショット分類 #XNLIファインチューニング #クロスランゲージ推論

ダウンロード数 18

リリース時間 : 6/18/2023

モデル概要

intfloat/multilingual-e5-baseモデルを基に、XNLIデータセットでファインチューニングされており、多言語自然言語推論とゼロショット分類タスクに適しています。

モデル特徴

多言語サポート

15言語のゼロショット分類と自然言語推論タスクをサポートします。

XNLIファインチューニング

XNLIデータセットでファインチューニングされており、多言語自然言語推論性能を最適化しています。

ゼロショット分類能力

特定のタスク訓練なしで新しいカテゴリに分類できます。

モデル能力

多言語テキスト分類

自然言語推論

ゼロショット学習

使用事例

テキスト分類

ニュース分類

ニューステキストを政治、経済、エンターテインメントなどのカテゴリに分類します。

XNLIテストセットで中国語の精度0.785を達成しました。

自然言語理解

テキスト含意判定

2つのテキスト間の論理関係（含意/中立/矛盾）を判断します。

XNLIテストセットで英語の精度0.849を達成しました。

🚀 multilingual-e5-base-xnli

このモデルは、XNLIデータセットでintfloat/multilingual-e5-baseをファインチューニングしたバージョンです。多言語のゼロショット分類タスクに使用でき、XNLIデータセットを用いて評価されています。

🚀 クイックスタート

このモデルは、XNLIデータセットで事前学習された多言語モデルで、ゼロショット分類やNLIタスクに使用できます。以下に使い方を説明します。

✨ 主な機能

多言語対応: 英語、アラビア語、ブルガリア語など15言語に対応しています。
ゼロショット分類: 事前に学習していないクラスに対しても分類が可能です。
NLIタスク対応: 自然言語推論タスクにも適用できます。

💻 使用例

基本的な使用法

zero-shot-classificationパイプラインを使用してモデルをロードすることができます。

from transformers import pipeline
classifier = pipeline("zero-shot-classification",
                      model="mjwong/multilingual-e5-base-xnli")

このパイプラインを使用して、指定したクラス名にシーケンスを分類することができます。

sequence_to_classify = "Angela Merkel ist eine Politikerin in Deutschland und Vorsitzende der CDU"
candidate_labels = ["politics", "economy", "entertainment", "environment"]
classifier(sequence_to_classify, candidate_labels)

複数の候補ラベルが正しい場合、multi_class=Trueを渡して各クラスを独立して計算することができます。

candidate_labels = ["politics", "economy", "entertainment", "environment"]
classifier(sequence_to_classify, candidate_labels, multi_label=True)

高度な使用法

手動でPyTorchを使用して、NLIタスクにモデルを適用することもできます。

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# device = "cuda:0" or "cpu"
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

model_name = "mjwong/multilingual-e5-base-xnli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "But I thought you'd sworn off coffee."
hypothesis = "I thought that you vowed to drink more coffee."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 2) for pred, name in zip(prediction, label_names)}
print(prediction)

📚 ドキュメント

評価結果

このモデルは、XNLIのテストセットを使用して15言語で評価されました。評価指標は正解率です。

データセット	英語 (en)	アラビア語 (ar)	ブルガリア語 (bg)	ドイツ語 (de)	ギリシャ語 (el)	スペイン語 (es)	フランス語 (fr)	ヒンディー語 (hi)	ロシア語 (ru)	スワヒリ語 (sw)	タイ語 (th)	トルコ語 (tr)	ウルドゥー語 (ur)	ベトナム語 (vi)	中国語 (zh)
multilingual-e5-base-xnli	0.849	0.768	0.803	0.800	0.792	0.809	0.805	0.738	0.782	0.728	0.756	0.766	0.713	0.787	0.785
multilingual-e5-base-xnli-anli	0.811	0.711	0.751	0.759	0.746	0.778	0.765	0.685	0.728	0.662	0.705	0.716	0.683	0.736	0.740
multilingual-e5-large-xnli	0.867	0.791	0.832	0.825	0.823	0.837	0.824	0.778	0.806	0.749	0.787	0.793	0.738	0.813	0.808
multilingual-e5-large-xnli-anli	0.865	0.765	0.811	0.811	0.795	0.823	0.816	0.743	0.785	0.713	0.765	0.774	0.706	0.788	0.787
multilingual-e5-large-instruct-xnli	0.864	0.793	0.839	0.821	0.824	0.837	0.823	0.770	0.810	0.744	0.784	0.791	0.716	0.807	0.807
multilingual-e5-large-instruct-xnli-anli	0.861	0.780	0.816	0.808	0.806	0.825	0.816	0.758	0.799	0.727	0.775	0.780	0.721	0.787	0.795

また、MultiNLIの開発セットとANLIのテストセットを使用して評価されました。評価指標は正解率です。

データセット	mnli_dev_m	mnli_dev_mm	anli_test_r1	anli_test_r2	anli_test_r3
multilingual-e5-base-xnli	0.835	0.837	0.287	0.276	0.301
multilingual-e5-base-xnli-anli	0.814	0.811	0.588	0.437	0.439
multilingual-e5-large-xnli	0.865	0.865	0.312	0.316	0.300
multilingual-e5-large-xnli-anli	0.863	0.863	0.623	0.456	0.455
multilingual-e5-large-instruct-xnli	0.867	0.866	0.341	0.330	0.323
multilingual-e5-large-instruct-xnli-anli	0.862	0.862	0.615	0.459	0.462

学習ハイパーパラメータ

学習時には以下のハイパーパラメータが使用されました。

属性	詳情
学習率 (learning_rate)	2e-05
学習バッチサイズ (train_batch_size)	16
評価バッチサイズ (eval_batch_size)	16
シード (seed)	42
オプティマイザー (optimizer)	Adam (betas=(0.9, 0.999), epsilon=1e-08)
学習率スケジューラーの種類 (lr_scheduler_type)	線形 (linear)
学習率スケジューラーのウォームアップ比率 (lr_scheduler_warmup_ratio)	0.1
エポック数 (num_epochs)	1