nli-deberta-v3-large開源自然語言推理模型

首頁

Nli Deberta V3 Large

由cross-encoder開發

基於DeBERTa-v3-large架構的自然語言推理模型，在SNLI和MultiNLI數據集上訓練，用於判斷句子對之間的關係。

文本分類

Transformers

英語開源協議:Apache-2.0 #零樣本分類 #高精度NLI #句子對推理

下載量 203.73k

發布時間 : 3/2/2022

模型概述

該模型是一個用於自然語言推理任務的交叉編碼器，能夠判斷兩個句子之間是矛盾、蘊含還是中立關係。基於微軟DeBERTa-v3-large架構，在SNLI和MultiNLI數據集上訓練。

模型特點

高準確率

在SNLI測試集上達到92.2%準確率，在MNLI不匹配集上達到90.49%準確率

多功能應用

既可用於自然語言推理任務，也可用於零樣本分類任務

基於強大架構

採用微軟DeBERTa-v3-large架構，具備優秀的語言理解能力

模型能力

自然語言推理

零樣本分類

句子關係判斷

使用案例

文本分析

矛盾檢測

判斷兩個句子是否相互矛盾

可準確識別矛盾關係

邏輯推理

判斷一個句子是否蘊含另一個句子的含義

可準確識別蘊含關係

分類任務

零樣本分類

無需訓練即可對文本進行分類

適用於多種分類場景

🚀 自然語言推理跨編碼器

本模型用於自然語言推理，藉助SentenceTransformers庫訓練，能對句子對進行分類，輸出矛盾、蘊含、中立三種標籤的得分，可用於零樣本分類等場景。

🚀 快速開始

本模型使用 SentenceTransformers 的 Cross-Encoder 類進行訓練。該模型基於 microsoft/deberta-v3-large。

✨ 主要特性

基於 microsoft/deberta-v3-large 模型進行訓練。
可對給定的句子對輸出對應矛盾、蘊含、中立三種標籤的得分。
可用於零樣本分類任務。

📦 安裝指南

文檔未提及具體安裝步驟，可參考相關庫的官方文檔進行安裝：

💻 使用示例

基礎用法

預訓練模型可以按如下方式使用：

from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/nli-deberta-v3-large')
scores = model.predict([('A man is eating pizza', 'A man eats something'), ('A black race car starts up in front of a crowd of people.', 'A man is driving down a lonely road.')])

#Convert scores to labels
label_mapping = ['contradiction', 'entailment', 'neutral']
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高級用法

你也可以直接使用 Transformers 庫（不使用 SentenceTransformers 庫）來使用該模型：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-v3-large')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-v3-large')

features = tokenizer(['A man is eating pizza', 'A black race car starts up in front of a crowd of people.'], ['A man eats something', 'A man is driving down a lonely road.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

零樣本分類用法

該模型還可用於零樣本分類：

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='cross-encoder/nli-deberta-v3-large')

sent = "Apple just announced the newest iPhone X"
candidate_labels = ["technology", "sports", "politics"]
res = classifier(sent, candidate_labels)
print(res)

📚 詳細文檔

訓練數據

該模型在 SNLI 和 MultiNLI 數據集上進行訓練。對於給定的句子對，它將輸出對應矛盾、蘊含、中立三種標籤的得分。

性能表現

在 SNLI 測試數據集上的準確率：92.20
在 MNLI 不匹配集上的準確率：90.49

更多評估結果，請參考 SBERT.net - 預訓練跨編碼器。

📄 許可證

本模型使用的許可證為 apache-2.0。

📋 模型信息

屬性	詳情
模型類型	用於自然語言推理的跨編碼器
訓練數據	SNLI 和 MultiNLI 數據集
評估指標	準確率
基礎模型	microsoft/deberta-v3-large
庫名稱	sentence-transformers