nli - deberta - v3 - base開源模型 - 免費部署助力自然語言推理，判斷句子關係

首頁

Nli Deberta V3 Base

由cross-encoder開發

基於microsoft/deberta-v3-base訓練的交叉編碼器模型，用於自然語言推理任務，能夠判斷句子對之間的關係（矛盾、蘊含或中立）。

文本分類

Transformers

英語開源協議:Apache-2.0 #零樣本分類 #文本蘊含識別 #多標籤推理

下載量 65.55k

發布時間 : 3/2/2022

模型概述

該模型是一個自然語言推理(NLI)交叉編碼器，專門用於判斷兩個句子之間的關係，輸出矛盾、蘊含或中立三種標籤的概率分數。

模型特點

高準確率

在SNLI和MultiNLI數據集上分別達到92.38%和90.04%的準確率

多語言支持

雖然主要針對英語訓練，但可以處理中文文本的自然語言推理任務

零樣本分類能力

可用於零樣本分類場景，無需特定領域訓練數據

模型能力

自然語言推理

文本關係判斷

零樣本分類

使用案例

文本分析

問答系統驗證

驗證問答系統中答案與問題的邏輯一致性

可準確判斷答案是否蘊含問題所需信息

內容審核

檢測用戶生成內容中的矛盾陳述

識別文本中的不一致或矛盾之處

信息檢索

搜索結果相關性評估

評估搜索結果與查詢意圖的相關性

判斷搜索結果是否蘊含查詢意圖

🚀 自然語言推理跨編碼器

本模型用於自然語言推理任務，基於預訓練模型構建，能對給定的句子對進行分類，輸出矛盾、蘊含、中立三種標籤對應的分數，可應用於零樣本分類等場景。

🚀 快速開始

本模型使用 SentenceTransformers 的 Cross-Encoder 類進行訓練，基於 microsoft/deberta-v3-base 模型。

✨ 主要特性

基於預訓練模型構建，能對句子對進行分類，輸出矛盾、蘊含、中立三種標籤對應的分數。
可用於零樣本分類任務。

📦 安裝指南

暫未提及安裝步驟，可參考 SentenceTransformers 和 Transformers 官方文檔進行安裝。

💻 使用示例

基礎用法

預訓練模型可以按如下方式使用：

from sentence_transformers import CrossEncoder
model = CrossEncoder('cross-encoder/nli-deberta-v3-base')
scores = model.predict([('A man is eating pizza', 'A man eats something'), ('A black race car starts up in front of a crowd of people.', 'A man is driving down a lonely road.')])

#Convert scores to labels
label_mapping = ['contradiction', 'entailment', 'neutral']
labels = [label_mapping[score_max] for score_max in scores.argmax(axis=1)]

高級用法

你也可以直接使用 Transformers 庫（不使用 SentenceTransformers 庫）來使用該模型：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model = AutoModelForSequenceClassification.from_pretrained('cross-encoder/nli-deberta-v3-base')
tokenizer = AutoTokenizer.from_pretrained('cross-encoder/nli-deberta-v3-base')

features = tokenizer(['A man is eating pizza', 'A black race car starts up in front of a crowd of people.'], ['A man eats something', 'A man is driving down a lonely road.'],  padding=True, truncation=True, return_tensors="pt")

model.eval()
with torch.no_grad():
    scores = model(**features).logits
    label_mapping = ['contradiction', 'entailment', 'neutral']
    labels = [label_mapping[score_max] for score_max in scores.argmax(dim=1)]
    print(labels)

零樣本分類用法

該模型還可用於零樣本分類：

from transformers import pipeline

classifier = pipeline("zero-shot-classification", model='cross-encoder/nli-deberta-v3-base')

sent = "Apple just announced the newest iPhone X"
candidate_labels = ["technology", "sports", "politics"]
res = classifier(sent, candidate_labels)
print(res)

📚 詳細文檔

訓練數據

該模型在 SNLI 和 MultiNLI 數據集上進行訓練。對於給定的句子對，它將輸出對應於矛盾、蘊含、中立三種標籤的分數。

性能表現

在 SNLI 測試數據集上的準確率：92.38
在 MNLI 不匹配集上的準確率：90.04

更多評估結果，請參考 SBERT.net - 預訓練跨編碼器。

📄 許可證

本模型使用 Apache 2.0 許可證。

屬性	詳情
模型類型	自然語言推理跨編碼器
訓練數據	SNLI 和 MultiNLI 數據集
基礎模型	microsoft/deberta-v3-base
庫名稱	sentence-transformers
指標	準確率
許可證	Apache 2.0
任務類型	零樣本分類
標籤	transformers