nli-deberta-v3-xsmallオープンソースモデル - 自然言語推論タスクに無料で利用可能

ホーム

Nli Deberta V3 Xsmall

cross-encoderによって開発

microsoft/deberta-v3-xsmallを基に訓練されたクロスエンコーダモデルで、自然言語推論タスクに使用

テキスト分類

Transformers

英語オープンソースライセンス:Apache-2.0 #ゼロショット分類 #意味関係推論 #マルチラベル評価

ダウンロード数 16.62k

リリース時間 : 3/2/2022

モデル概要

このモデルはSentenceTransformersのクロスエンコーダクラスを使用して訓練され、自然言語推論(NLI)タスクを処理するために特別に設計されており、2つの文の関係（矛盾、含意、または中立）を判断できます。

モデル特徴

効率的な推論能力

DeBERTa-v3-xsmallアーキテクチャを基にしており、比較的高い精度を維持しながら高い推論効率を実現

複数データセットでの訓練

SNLIとMultiNLIの2つの大規模な自然言語推論データセットで共同訓練

ゼロショット分類のサポート

追加の訓練なしで直接ゼロショット分類タスクに使用可能

モデル能力

自然言語推論

テキスト関係判断

ゼロショット分類

使用事例

テキスト分析

矛盾検出

2つの文の間に矛盾関係があるかどうかを検出

ファクトチェックなどのシナリオに使用可能

テキスト含意分析

ある文が別の文の意味を含意しているかどうかを判断

質問応答システム、情報検索などのシナリオに使用可能

分類システム

ゼロショットテキスト分類

特定のドメインの訓練データがない状況で分類を実行

迅速な分類システムの構築に適している

🚀 自然言語推論用クロスエンコーダ

このモデルは、自然言語推論（NLI）のタスクに特化したクロスエンコーダモデルです。SentenceTransformersライブラリを用いて訓練され、高い精度で文の関係性を判断することができます。

🚀 クイックスタート

このモデルは、SentenceTransformers の Cross-Encoder クラスを使用して訓練されています。ベースモデルは microsoft/deberta-v3-xsmall です。

✨ 主な機能

与えられた文のペアに対して、矛盾（contradiction）、含意（entailment）、中立（neutral）の3つのラベルに対応するスコアを出力します。
ゼロショット分類（zero-shot classification）にも利用可能です。

📦 インストール

このモデルを使用するには、sentence-transformers または transformers ライブラリが必要です。以下のコマンドでインストールできます。

pip install sentence-transformers
pip install transformers

💻 使用例

基本的な使用法

from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/nli-deberta-v3-xsmall')
scores = model.predict([('A man is eating pizza', 'A man eats something'), ('A black race car starts up in front of a crowd of people.', 'A man is driving down a lonely road.')])

#Convert scores to labels
label_mapping = ['contradiction', 'entailment', 'neutral']
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高度な使用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-v3-xsmall')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-v3-xsmall')

features = tokenizer(['A man is eating pizza', 'A black race car starts up in front of a crowd of people.'], ['A man eats something', 'A man is driving down a lonely road.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

ゼロショット分類の使用法

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='cross-encoder/nli-deberta-v3-xsmall')

sent = "Apple just announced the newest iPhone X"
candidate_labels = ["technology", "sports", "politics"]
res = classifier(sent, candidate_labels)
print(res)

📚 ドキュメント

訓練データ

このモデルは、SNLI と MultiNLI データセットで訓練されています。

性能

SNLIテストデータセットでの精度: 91.64
MNLIミスマッチセットでの精度: 87.77

詳細な評価結果については、SBERT.net - Pretrained Cross-Encoder を参照してください。

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下で提供されています。

📋 情報テーブル

属性	詳情
パイプラインタグ	ゼロショット分類 (zero-shot-classification)
タグ	transformers
データセット	nyu-mll/multi_nli, stanfordnlp/snli
評価指標	精度 (accuracy)
ライセンス	apache-2.0
ベースモデル	microsoft/deberta-v3-xsmall
ライブラリ名	sentence-transformers