deberta-v3-large_boolq開源文本分類模型 - 高效精準回答布爾型問題

首頁

Deberta V3 Large Boolq

由nfliu開發

該模型是基於microsoft/deberta-v3-large在boolq數據集上微調得到的文本分類模型，用於回答布爾型問題。

文本分類

Transformers

開源協議:MIT #問答分類 #高準確率 #自然語言理解

下載量 32.15k

發布時間 : 9/7/2023

模型概述

該模型專門用於處理布爾型問題回答任務，能夠根據提供的上下文判斷問題的真假。

模型特點

高準確率

在boolq驗證集上達到88.35%的準確率

基於DeBERTa-v3

使用先進的DeBERTa-v3-large架構，具有強大的文本理解能力

模型能力

布爾型問題回答

文本分類

上下文理解

使用案例

問答系統

事實核查

根據提供的上下文驗證陳述的真實性

準確率達到88.35%

自動問答

回答需要是/否回答的問題

🚀 deberta-v3-large_boolq

本模型是 microsoft/deberta-v3-large 在 boolq 數據集上的微調版本。它在評估集上取得了如下結果：

損失值：0.4601
準確率：0.8835

🚀 快速開始

本模型是 microsoft/deberta-v3-large 在 boolq 數據集上進行微調得到的。在評估集上，它展現出了良好的性能，損失值為 0.4601，準確率達到了 0.8835。

💻 使用示例

基礎用法

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model = AutoModelForSequenceClassification.from_pretrained("nfliu/deberta-v3-large_boolq")
tokenizer = AutoTokenizer.from_pretrained("nfliu/deberta-v3-large_boolq")

# Each example is a (question, context) pair.
examples = [
    ("Lake Tahoe is in California", "Lake Tahoe is a popular tourist spot in California."),
    ("Water is wet", "Contrary to popular belief, water is not wet.")
]

encoded_input = tokenizer(examples, padding=True, truncation=True, return_tensors="pt")

with torch.no_grad():
    model_output = model(**encoded_input)
    probabilities = torch.softmax(model_output.logits, dim=-1).cpu().tolist()

probability_no = [round(prob[0], 2) for prob in probabilities]
probability_yes = [round(prob[1], 2) for prob in probabilities]

for example, p_no, p_yes in zip(examples, probability_no, probability_yes):
    print(f"Question: {example[0]}")
    print(f"Context: {example[1]}")
    print(f"p(No | question, context): {p_no}")
    print(f"p(Yes | question, context): {p_yes}")
    print()