e5-base-v2-mnli-anliオープンソースモデル - 無料デプロイでゼロショット分類と自然言語推論をサポート

ホーム

E5 Base V2 Mnli Anli

mjwongによって開発

このモデルはintfloat/e5-base-v2をGLUE（MNLI）とANLIデータセットでファインチューニングしたバージョンで、ゼロショット分類と自然言語推論タスクに適しています。

テキスト分類

Transformers

英語オープンソースライセンス:MIT #ゼロショット分類 #自然言語推論 #マルチターン対話理解

ダウンロード数 6,598

リリース時間 : 7/23/2023

モデル概要

弱教師あり対照事前学習によって生成されたテキスト埋め込みモデルで、主に自然言語推論とゼロショット分類タスクに使用されます。

モデル特徴

ゼロショット分類能力

特定のタスク訓練なしでテキストを分類可能

自然言語推論

2つの文間の論理関係（含意/中立/矛盾）を判断可能

複数データセットでのファインチューニング

GLUE(MNLI)とANLIデータセットでファインチューニングを行い、推論能力を向上

モデル能力

テキスト分類

自然言語推論

ゼロショット学習

使用事例

テキスト分析

感情分類

訓練なしでテキストの感情を分類可能

トピック分類

テキストの属するトピックカテゴリを識別

論理推論

テキスト一貫性判断

2つの文間の論理関係を判断

MNLIとANLIデータセットで良好な性能

🚀 e5-base-v2-mnli-anli

このモデルは、glue (mnli) およびanliデータセットで intfloat/e5-base-v2 をファインチューニングしたバージョンです。

🚀 クイックスタート

モデルの説明

Text Embeddings by Weakly-Supervised Contrastive Pre-training Liang Wang, Nan Yang, Xiaolong Huang, Binxing Jiao, Linjun Yang, Daxin Jiang, Rangan Majumder, Furu Wei, arXiv 2022

モデルの使い方

ゼロショット分類パイプラインを使用する場合

モデルは、zero-shot-classification パイプラインを使って次のようにロードできます。

from transformers import pipeline
classifier = pipeline("zero-shot-classification",
                      model="mjwong/e5-base-v2-mnli-anli")

このパイプラインを使って、指定した任意のクラス名にシーケンスを分類できます。

sequence_to_classify = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(sequence_to_classify, candidate_labels)

複数の候補ラベルが正しい可能性がある場合、multi_class=True を渡して各クラスを独立して計算できます。

candidate_labels = ['travel', 'cooking', 'dancing', 'exploration']
classifier(sequence_to_classify, candidate_labels, multi_class=True)

手動でPyTorchを使用する場合

モデルは、次のようにNLIタスクにも適用できます。

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# device = "cuda:0" or "cpu"
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

model_name = "mjwong/e5-base-v2-mnli-anli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "But I thought you'd sworn off coffee."
hypothesis = "I thought that you vowed to drink more coffee."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 2) for pred, name in zip(prediction, label_names)}
print(prediction)

評価結果

このモデルは、MultiNLIの開発セットとANLIのテストセットを使用して評価されました。使用された指標は正解率です。

データセット	mnli_dev_m	mnli_dev_mm	anli_test_r1	anli_test_r2	anli_test_r3
e5-base-v2-mnli-anli	0.812	0.809	0.557	0.460	0.448
e5-large-mnli	0.868	0.869	0.301	0.296	0.294
e5-large-mnli-anli	0.843	0.848	0.646	0.484	0.458
e5-large-v2-mnli	0.875	0.876	0.354	0.298	0.313
e5-large-v2-mnli-anli	0.846	0.848	0.638	0.474	0.479