nli - deberta - v3 - baseオープンソースモデル - 無料デプロイで自然言語推論をサポート、文の関係を判断する

ホーム

Nli Deberta V3 Base

cross-encoderによって開発

microsoft/deberta-v3-baseを基に訓練されたクロスエンコーダモデルで、自然言語推論タスクに使用され、文ペア間の関係（矛盾、含意、または中立）を判断できます。

テキスト分類

Transformers

英語オープンソースライセンス:Apache-2.0 #ゼロショット分類 #テキスト含意認識 #マルチラベル推論

ダウンロード数 65.55k

リリース時間 : 3/2/2022

モデル概要

このモデルは自然言語推論(NLI)クロスエンコーダで、2つの文の関係を判断するために特別に設計されており、矛盾、含意、または中立の3つのラベルの確率スコアを出力します。

モデル特徴

高精度

SNLIとMultiNLIデータセットでそれぞれ92.38%と90.04%の精度を達成

多言語サポート

主に英語向けに訓練されていますが、中国語テキストの自然言語推論タスクも処理可能

ゼロショット分類能力

特定ドメインの訓練データが不要なゼロショット分類シナリオに使用可能

モデル能力

自然言語推論

テキスト関係判断

ゼロショット分類

使用事例

テキスト分析

QAシステム検証

QAシステムにおける回答と質問の論理的一貫性を検証

回答が質問に必要な情報を含むかどうかを正確に判断

コンテンツモデレーション

ユーザー生成コンテンツ内の矛盾した記述を検出

テキスト内の不一致や矛盾点を識別

情報検索

検索結果関連性評価

検索結果とクエリ意図の関連性を評価

検索結果がクエリ意図を含むかどうかを判断

🚀 自然言語推論用クロスエンコーダ

このモデルは、自然言語推論（NLI）タスクに特化したクロスエンコーダモデルです。SentenceTransformers の Cross-Encoder クラスを使用して学習され、microsoft/deberta-v3-base をベースに構築されています。

📦 インストール

このモデルを使用するには、sentence-transformers または transformers ライブラリが必要です。以下のコマンドでインストールできます。

pip install sentence-transformers transformers

✨ 主な機能

高精度な自然言語推論：SNLI と MultiNLI データセットで学習され、高い精度で矛盾、含意、中立の関係を判断します。
ゼロショット分類：事前学習済みのモデルを使用して、新しいクラスに対する分類タスクを実行できます。

📚 ドキュメント

モデル情報

属性	詳情
モデルタイプ	自然言語推論用クロスエンコーダ
学習データ	SNLI と MultiNLI データセット
ベースモデル	microsoft/deberta-v3-base
ライブラリ名	sentence-transformers

パフォーマンス

SNLI テストデータセットでの精度: 92.38
MNLI 不一致セットでの精度: 90.04

詳細な評価結果については、SBERT.net - Pretrained Cross-Encoder を参照してください。

💻 使用例

基本的な使用法

事前学習済みのモデルは次のように使用できます。

from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/nli-deberta-v3-base')
scores = model.predict([('A man is eating pizza', 'A man eats something'), ('A black race car starts up in front of a crowd of people.', 'A man is driving down a lonely road.')])

#Convert scores to labels
label_mapping = ['contradiction', 'entailment', 'neutral']
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高度な使用法

Transformers AutoModel を使用した場合

transformers ライブラリを直接使用してモデルを利用することもできます（SentenceTransformers ライブラリを使用せずに）。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-v3-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-v3-base')

features = tokenizer(['A man is eating pizza', 'A black race car starts up in front of a crowd of people.'], ['A man eats something', 'A man is driving down a lonely road.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

ゼロショット分類

このモデルはゼロショット分類にも使用できます。

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='cross-encoder/nli-deberta-v3-base')

sent = "Apple just announced the newest iPhone X"
candidate_labels = ["technology", "sports", "politics"]
res = classifier(sent, candidate_labels)
print(res)