nli-deberta-baseオープンソースモデル - 文のペアの論理関係を判断する自然言語推論の強力なツール

ホーム

Nli Deberta Base

cross-encoderによって開発

DeBERTaアーキテクチャに基づく自然言語推論クロスエンコーダで、文ペア間の論理関係を判断するために使用されます。

テキスト分類

Transformers

英語オープンソースライセンス:Apache-2.0 #ゼロショット分類 #テキスト含意識別 #マルチラベル推論

ダウンロード数 2,299

リリース時間 : 3/2/2022

モデル概要

このモデルはSentenceTransformersフレームワークを用いて訓練され、自然言語推論タスクに特化しており、2つの文間の論理関係（矛盾、含意、または中立）を判断することができます。

モデル特徴

自然言語推論

2つの文間の論理関係（矛盾、含意、または中立）を正確に判断することができます。

ゼロショット分類

ゼロショット分類タスクをサポートし、特定のドメインの訓練データがなくても分類を行うことができます。

多言語対応

主に中国語を対象としていますが、DeBERTaアーキテクチャに基づいて他の言語を処理する能力も備えています。

モデル能力

自然言語推論

ゼロショット分類

テキスト関係分析

使用事例

テキスト分析

矛盾検出

2つの文間に矛盾関係があるかどうかを検出します。

テキスト中の矛盾陳述を正確に識別することができます。

論理推論

ある文が別の文の意味を含んでいるかどうかを判断します。

質問応答システムの推論モジュールの構築に使用できます。

コンテンツ審査

事実検証

新しいコンテンツが既知の事実と一致するかどうかを検証します。

虚偽または矛盾する情報を識別するのに役立ちます。

🚀 自然言語推論用クロスエンコーダ

このモデルは、自然言語推論を行うためのクロスエンコーダです。SentenceTransformersを用いて訓練され、SNLIやMultiNLIデータセットを利用しています。

🚀 クイックスタート

このモデルは、SentenceTransformers の Cross-Encoder クラスを使用して訓練されました。

✨ 主な機能

与えられた文のペアに対して、矛盾、含意、中立の3つのラベルに対応するスコアを出力します。
事前学習済みモデルを簡単に使用できます。
Transformersライブラリを直接使用することも可能です。
ゼロショット分類にも利用できます。

📦 インストール

このモデルを使用するには、sentence-transformers または transformers ライブラリが必要です。以下のコマンドでインストールできます。

pip install sentence-transformers
pip install transformers

💻 使用例

基本的な使用法

事前学習済みモデルの使用例です。

from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/nli-deberta-base')
scores = model.predict([('A man is eating pizza', 'A man eats something'), ('A black race car starts up in front of a crowd of people.', 'A man is driving down a lonely road.')])

#Convert scores to labels
label_mapping = ['contradiction', 'entailment', 'neutral']
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高度な使用法

Transformersライブラリを直接使用する例です。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-base')

features = tokenizer(['A man is eating pizza', 'A black race car starts up in front of a crowd of people.'], ['A man eats something', 'A man is driving down a lonely road.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

ゼロショット分類の使用法

このモデルをゼロショット分類に使用する例です。

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='cross-encoder/nli-deberta-base')

sent = "Apple just announced the newest iPhone X"
candidate_labels = ["technology", "sports", "politics"]
res = classifier(sent, candidate_labels)
print(res)

📚 ドキュメント

訓練データ

このモデルは、SNLI と MultiNLI データセットで訓練されました。

性能

評価結果については、SBERT.net - Pretrained Cross-Encoder を参照してください。

📄 ライセンス

このモデルは、Apache-2.0ライセンスの下で公開されています。

プロパティ	詳細
モデルタイプ	自然言語推論用クロスエンコーダ
訓練データ	SNLIとMultiNLIデータセット
メトリクス	精度
ベースモデル	microsoft/deberta-base
ライブラリ名	sentence-transformers