DeBERTa-v3-large-mnli开源模型 - 免费部署实现文本蕴含关系精准判断

首页

Deberta V3 Large Mnli

由 khalidalt 开发

基于MultiNLI数据集训练的DeBERTa-v3-large模型，用于文本蕴含关系判断

文本分类

Transformers

英语#文本蕴含推理 #高精度NLI #零样本分类

下载量 150

发布时间 : 3/2/2022

模型简介

该模型基于微软DeBERTa-v3-large架构，通过多体裁自然语言推理(MultiNLI)数据集训练，专门用于判断两段文本之间的蕴含关系（蕴含/中立/矛盾）。

模型特点

解耦注意力机制

采用创新的解耦注意力机制，增强了模型对文本关系的理解能力

增强型掩码解码器

使用增强型掩码解码器，提高了模型在NLU任务中的表现

多体裁训练

基于包含43.3万组样本的MultiNLI数据集训练，涵盖多种文本类型

模型能力

文本蕴含判断

零样本分类

自然语言推理

使用案例

情感分析

影评情感判断

分析电影评论中的情感倾向

可准确判断评论是否支持电影

内容审核

矛盾内容检测

识别用户生成内容中的矛盾陈述

可用于检测虚假或误导性信息

🚀 DeBERTa-v3-large-mnli

本模型主要用于文本分类和零样本分类任务，通过在MultiNLI数据集上进行训练，能够有效处理文本蕴含信息，在自然语言理解方面具有较高的准确性。

🚀 快速开始

下面是一个使用该模型进行文本蕴含预测的示例代码：

premise = "The Movie have been criticized for the story. However, I think it is a great movie."
hypothesis = "I liked the movie."
input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1)
label_names = ["entailment", "neutral", "contradiction"]
print(label_names[prediction.argmax(0).tolist()])

✨ 主要特性

该模型在Multi - Genre Natural Language Inference (MultiNLI)数据集上进行训练，此数据集包含433k句子对的文本蕴含信息。
采用了微软的DeBERTa - v3 - large模型，通过解耦注意力和增强掩码解码器，在大多数NLU基准测试中优于Bert和RoBERTa的结果。

📚 详细文档

模型描述

此模型在Multi - Genre Natural Language Inference (MultiNLI)数据集上进行训练，该数据集由433k句子对的文本蕴含信息组成。所使用的模型是微软的DeBERTa - v3 - large。v3版本的DeBERTa通过使用解耦注意力和增强掩码解码器，在大多数NLU基准测试中优于Bert和RoBERTa的结果。有关原始模型的更多信息，请参阅官方仓库和论文。

预期用途和限制

如何使用模型

示例代码展示了如何使用该模型进行文本蕴含预测，具体代码如下：

premise = "The Movie have been criticized for the story. However, I think it is a great movie."
hypothesis = "I liked the movie."
input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1)
label_names = ["entailment", "neutral", "contradiction"]
print(label_names[prediction.argmax(0).tolist()])

训练数据

该模型在MultiNLI数据集上进行训练，该数据集由392K句子的文本蕴含信息组成。

训练过程

DeBERTa - v3 - large - mnli使用Hugging Face训练器进行训练，使用了以下超参数：

train_args = TrainingArguments(
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=3,
    warmup_ratio=0.06,
    weight_decay=0.1,
    fp16=True,
    seed=42,
)