drama-large-xnli-anliオープンソースゼロショット分類モデル - 15種類の言語の自然言語推論タスクをサポート

ホーム

Drama Large Xnli Anli

mjwongによって開発

facebook/drama-largeをXNLIとANLIデータセットでファインチューニングしたゼロショット分類モデルで、15言語の自然言語推論タスクをサポートします。

大規模言語モデル

Safetensors

複数言語対応#多言語NLI #ゼロショット分類 #意味推論

ダウンロード数 23

リリース時間 : 3/1/2025

モデル概要

このモデルはゼロショット分類と多言語自然言語推論タスク用のファインチューニング版で、特に言語間テキスト分類と推論シナリオに適しています。

モデル特徴

多言語サポート

15言語のゼロショット分類と自然言語推論タスクをサポート

高性能推論

XNLIとANLIデータセットで優れた性能を発揮、特に英語と主要言語で顕著

ゼロショット分類能力

特定タスクのトレーニングなしで新規カテゴリを分類可能

モデル能力

ゼロショットテキスト分類

多言語自然言語推論

言語間テキスト理解

多クラス分類

使用事例

テキスト分類

多言語コンテンツ分類

ニュース分類や製品レビュー分類など、多言語テキストコンテンツの分類

15言語で良好な分類精度を達成

自然言語推論

言語間テキスト推論

2つの言語テキスト間の論理関係（含意、中立、矛盾）を判断

XNLIデータセットで英語精度79.9%、その他言語59.4%-75.4%の精度

🚀 drama-large-xnli-anli

このモデルは、XNLIとANLIデータセットでfacebook/drama-largeをファインチューニングしたバージョンです。

🚀 クイックスタート

モデルの説明

DRAMA: Diverse Augmentation from Large Language Models to Smaller Dense Retrievers Xueguang Ma, Xi Victoria Lin, Barlas Oguz, Jimmy Lin, Wen-tau Yih, Xilun Chen, arXiv 2025

モデルの使用方法

ゼロショット分類パイプラインを使用する場合

モデルはzero-shot-classificationパイプラインを使って以下のように読み込むことができます。

from transformers import AutoTokenizer, pipeline
model = "mjwong/drama-large-xnli-anli"
classifier = pipeline("zero-shot-classification",
                      model=model)

このパイプラインを使って、指定したクラス名のいずれかにシーケンスを分類することができます。

sequence_to_classify = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(sequence_to_classify, candidate_labels)

複数の候補ラベルが正しい場合、multi_class=Trueを渡して各クラスを独立して計算することができます。

candidate_labels = ['travel', 'cooking', 'dancing', 'exploration']
classifier(sequence_to_classify, candidate_labels, multi_class=True)

手動でPyTorchを使用する場合

モデルは以下のようにNLIタスクに適用することもできます。

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# device = "cuda:0" or "cpu"
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")

model_name = "mjwong/drama-large-xnli-anli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "But I thought you'd sworn off coffee."
hypothesis = "I thought that you vowed to drink more coffee."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 2) for pred, name in zip(prediction, label_names)}
print(prediction)

評価結果

このモデルは、XNLIのテストセットを使用して15の言語で評価されました。使用された指標は正解率です。

Datasets	en	ar	bg	de	el	es	fr	hi	ru	sw	th	tr	ur	vi	zh
drama-base-xnli-anli	0.788	0.689	0.708	0.715	0.696	0.732	0.737	0.647	0.711	0.636	0.676	0.664	0.588	0.708	0.710
drama-large-xnli-anli	0.799	0.698	0.730	0.721	0.717	0.754	0.754	0.649	0.718	0.652	0.678	0.656	0.594	0.719	0.719