deberta-v3-large_boolq开源文本分类模型 - 高效精准回答布尔型问题

首页

Deberta V3 Large Boolq

由 nfliu 开发

该模型是基于microsoft/deberta-v3-large在boolq数据集上微调得到的文本分类模型，用于回答布尔型问题。

文本分类

Transformers

开源协议:MIT #问答分类 #高准确率 #自然语言理解

下载量 32.15k

发布时间 : 9/7/2023

模型简介

该模型专门用于处理布尔型问题回答任务，能够根据提供的上下文判断问题的真假。

模型特点

高准确率

在boolq验证集上达到88.35%的准确率

基于DeBERTa-v3

使用先进的DeBERTa-v3-large架构，具有强大的文本理解能力

模型能力

布尔型问题回答

文本分类

上下文理解

使用案例

问答系统

事实核查

根据提供的上下文验证陈述的真实性

准确率达到88.35%

自动问答

回答需要是/否回答的问题

🚀 deberta-v3-large_boolq

本模型是 microsoft/deberta-v3-large 在 boolq 数据集上的微调版本。它在评估集上取得了如下结果：

损失值：0.4601
准确率：0.8835

🚀 快速开始

本模型是 microsoft/deberta-v3-large 在 boolq 数据集上进行微调得到的。在评估集上，它展现出了良好的性能，损失值为 0.4601，准确率达到了 0.8835。

💻 使用示例

基础用法

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model = AutoModelForSequenceClassification.from_pretrained("nfliu/deberta-v3-large_boolq")
tokenizer = AutoTokenizer.from_pretrained("nfliu/deberta-v3-large_boolq")

# Each example is a (question, context) pair.
examples = [
    ("Lake Tahoe is in California", "Lake Tahoe is a popular tourist spot in California."),
    ("Water is wet", "Contrary to popular belief, water is not wet.")
]

encoded_input = tokenizer(examples, padding=True, truncation=True, return_tensors="pt")

with torch.no_grad():
    model_output = model(**encoded_input)
    probabilities = torch.softmax(model_output.logits, dim=-1).cpu().tolist()

probability_no = [round(prob[0], 2) for prob in probabilities]
probability_yes = [round(prob[1], 2) for prob in probabilities]

for example, p_no, p_yes in zip(examples, probability_no, probability_yes):
    print(f"Question: {example[0]}")
    print(f"Context: {example[1]}")
    print(f"p(No | question, context): {p_no}")
    print(f"p(Yes | question, context): {p_yes}")
    print()