rubert-base-cased-nli-threeway開源模型 - 免費部署預測俄語文本邏輯關係

首頁

Rubert Base Cased Nli Threeway

由cointegrated開發

基於DeepPavlov/rubert-base-cased微調的俄語自然語言推理模型，可預測兩段文本間的邏輯關係（蘊含/矛盾/中立）

文本分類

Transformers

其他#俄語自然語言推理 #三分類邏輯關係 #零樣本分類

下載量 144.68k

發布時間 : 3/2/2022

模型概述

該模型專門用於俄語自然語言推理任務，能夠判斷兩個文本片段之間的邏輯關係，支持三種分類：蘊含（entailment）、矛盾（contradiction）和中立（neutral）。

模型特點

多數據集訓練

基於多個從英語翻譯為俄語的NLI數據集訓練，包括JOCI、MNLI、MPE、SICK、SNLI等

零樣本分類能力

可通過自然語言推理方式實現零樣本短文本分類（如情感分析）

三分類邏輯關係

能夠區分文本間的三種邏輯關係：蘊含、矛盾和中立

模型能力

自然語言推理

零樣本分類

文本關係分析

使用案例

文本分析

邏輯關係判斷

判斷兩段俄語文本之間的邏輯關係（如前提與結論是否一致）

可輸出三種關係的概率分佈

情感分析

零樣本情感分類

通過定義正面/負面標籤文本，實現無需訓練的情感分析

示例顯示對負面評價識別準確率達94%

🚀 RuBERT用於自然語言推理（NLI）

這是一個基於DeepPavlov/rubert-base-cased微調的模型，用於預測兩個短文本之間的邏輯關係：蘊含、矛盾或中立。

🚀 快速開始

本模型可用於自然語言推理（NLI）和零樣本短文本分類。下面將分別介紹其使用方法。

✨ 主要特性

基於DeepPavlov/rubert-base-cased進行微調。
可預測兩個短文本之間的邏輯關係，包括蘊含、矛盾或中立。
支持零樣本短文本分類，例如情感分析。

📦 安裝指南

運行以下命令安裝所需的庫：

!pip install transformers sentencepiece --quiet

💻 使用示例

基礎用法

以下是如何運行該模型進行自然語言推理（NLI）的示例代碼：

import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model_checkpoint = 'cointegrated/rubert-base-cased-nli-threeway'
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint)
if torch.cuda.is_available():
    model.cuda()

text1 = 'Сократ - человек, а все люди смертны.'
text2 = 'Сократ никогда не умрёт.'
with torch.inference_mode():
    out = model(**tokenizer(text1, text2, return_tensors='pt').to(model.device))
    proba = torch.softmax(out.logits, -1).cpu().numpy()[0]
print({v: proba[k] for k, v in model.config.id2label.items()})
# {'entailment': 0.009525929, 'contradiction': 0.9332064, 'neutral': 0.05726764}

高級用法

你還可以使用此模型進行零樣本短文本分類（僅通過標籤），例如情感分析：

def predict_zero_shot(text, label_texts, model, tokenizer, label='entailment', normalize=True):
    label_texts
    tokens = tokenizer([text] * len(label_texts), label_texts, truncation=True, return_tensors='pt', padding=True)
    with torch.inference_mode():
        result = torch.softmax(model(**tokens.to(model.device)).logits, -1)
    proba = result[:, model.config.label2id[label]].cpu().numpy()
    if normalize:
        proba /= sum(proba)
    return proba

classes = ['Я доволен', 'Я недоволен']
predict_zero_shot('Какая гадость эта ваша заливная рыба!', classes, model, tokenizer)
# array([0.05609814, 0.9439019 ], dtype=float32)
predict_zero_shot('Какая вкусная эта ваша заливная рыба!', classes, model, tokenizer)
# array([0.9059292 , 0.09407079], dtype=float32)

另外，你也可以使用 Huggingface pipelines 進行推理。

📚 詳細文檔

模型來源

該模型在一系列從英語自動翻譯成俄語的NLI數據集上進行訓練。

大部分數據集取自 Felipe Salvatore的倉庫：

部分數據集從原始來源獲取：

性能表現

下表展示了五個模型在相應 dev 集上的ROC AUC（一類與其他類）：

模型	add_one_rte	anli_r1	anli_r2	anli_r3	copa	fever	help	iie	imppres	joci	mnli	monli	mpe	scitail	sick	snli	terra	total
n_observations	387	1000	1000	1200	200	20474	3355	31232	7661	939	19647	269	1000	2126	500	9831	307	101128
tiny/entailment	0.77	0.59	0.52	0.53	0.53	0.90	0.81	0.78	0.93	0.81	0.82	0.91	0.81	0.78	0.93	0.95	0.67	0.77
twoway/entailment	0.89	0.73	0.61	0.62	0.58	0.96	0.92	0.87	0.99	0.90	0.90	0.99	0.91	0.96	0.97	0.97	0.87	0.86
threeway/entailment	0.91	0.75	0.61	0.61	0.57	0.96	0.56	0.61	0.99	0.90	0.91	0.67	0.92	0.84	0.98	0.98	0.90	0.80
vicgalle-xlm/entailment	0.88	0.79	0.63	0.66	0.57	0.93	0.56	0.62	0.77	0.80	0.90	0.70	0.83	0.84	0.91	0.93	0.93	0.78
facebook-bart/entailment	0.51	0.41	0.43	0.47	0.50	0.74	0.55	0.57	0.60	0.63	0.70	0.52	0.56	0.68	0.67	0.72	0.64	0.58
threeway/contradiction		0.71	0.64	0.61		0.97			1.00	0.77	0.92		0.89		0.99	0.98		0.85
threeway/neutral		0.79	0.70	0.62		0.91			0.99	0.68	0.86		0.79		0.96	0.96		0.83