DeBERTa-v3-large-mnli開源模型 - 免費部署實現文本蘊含關係精準判斷

首頁

Deberta V3 Large Mnli

由khalidalt開發

基於MultiNLI數據集訓練的DeBERTa-v3-large模型，用於文本蘊含關係判斷

文本分類

Transformers

英語#文本蘊含推理 #高精度NLI #零樣本分類

下載量 150

發布時間 : 3/2/2022

模型概述

該模型基於微軟DeBERTa-v3-large架構，通過多體裁自然語言推理(MultiNLI)數據集訓練，專門用於判斷兩段文本之間的蘊含關係（蘊含/中立/矛盾）。

模型特點

解耦注意力機制

採用創新的解耦注意力機制，增強了模型對文本關係的理解能力

增強型掩碼解碼器

使用增強型掩碼解碼器，提高了模型在NLU任務中的表現

多體裁訓練

基於包含43.3萬組樣本的MultiNLI數據集訓練，涵蓋多種文本類型

模型能力

文本蘊含判斷

零樣本分類

自然語言推理

使用案例

情感分析

影評情感判斷

分析電影評論中的情感傾向

可準確判斷評論是否支持電影

內容審核

矛盾內容檢測

識別用戶生成內容中的矛盾陳述

可用於檢測虛假或誤導性信息

🚀 DeBERTa-v3-large-mnli

本模型主要用於文本分類和零樣本分類任務，通過在MultiNLI數據集上進行訓練，能夠有效處理文本蘊含信息，在自然語言理解方面具有較高的準確性。

🚀 快速開始

下面是一個使用該模型進行文本蘊含預測的示例代碼：

premise = "The Movie have been criticized for the story. However, I think it is a great movie."
hypothesis = "I liked the movie."
input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1)
label_names = ["entailment", "neutral", "contradiction"]
print(label_names[prediction.argmax(0).tolist()])

✨ 主要特性

該模型在Multi - Genre Natural Language Inference (MultiNLI)數據集上進行訓練，此數據集包含433k句子對的文本蘊含信息。
採用了微軟的DeBERTa - v3 - large模型，通過解耦注意力和增強掩碼解碼器，在大多數NLU基準測試中優於Bert和RoBERTa的結果。

📚 詳細文檔

模型描述

此模型在Multi - Genre Natural Language Inference (MultiNLI)數據集上進行訓練，該數據集由433k句子對的文本蘊含信息組成。所使用的模型是微軟的DeBERTa - v3 - large。v3版本的DeBERTa通過使用解耦注意力和增強掩碼解碼器，在大多數NLU基準測試中優於Bert和RoBERTa的結果。有關原始模型的更多信息，請參閱官方倉庫和論文。

預期用途和限制

如何使用模型

示例代碼展示瞭如何使用該模型進行文本蘊含預測，具體代碼如下：

premise = "The Movie have been criticized for the story. However, I think it is a great movie."
hypothesis = "I liked the movie."
input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1)
label_names = ["entailment", "neutral", "contradiction"]
print(label_names[prediction.argmax(0).tolist()])

訓練數據

該模型在MultiNLI數據集上進行訓練，該數據集由392K句子的文本蘊含信息組成。

訓練過程

DeBERTa - v3 - large - mnli使用Hugging Face訓練器進行訓練，使用了以下超參數：

train_args = TrainingArguments(
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=3,
    warmup_ratio=0.06,
    weight_decay=0.1,
    fp16=True,
    seed=42,
)