bart-large-finetuned-squadv1開源模型 - 免費部署助力自然語言問答與生成

首頁

Bart Large Finetuned Squadv1

由valhalla開發

這是一個針對問答任務在SQuADv1數據集上微調的BART-LARGE模型，適用於自然語言理解和生成任務。

問答系統 #長文本問答 #高精度閱讀理解 #序列到序列架構

下載量 959

發布時間 : 3/2/2022

模型概述

該模型是基於BART架構的序列到序列模型，專門針對問答任務進行了微調，能夠處理長達1024個標記的序列。

模型特點

長序列處理能力

能夠處理長達1024個標記的序列，適合處理較長文檔的問答任務。

雙向編碼器-解碼器架構

結合了雙向編碼器和自迴歸解碼器的優勢，適用於理解和生成任務。

高性能問答能力

在SQuADv1數據集上表現優異，F1值達到92.7。

模型能力

文本理解

問答系統

自然語言處理

使用案例

教育

自動問答系統

用於教育領域的自動問答系統，回答學生提出的問題。

能夠準確理解問題並從文檔中提取相關答案。

客戶服務

智能客服

用於客戶服務中的自動問答，快速響應客戶諮詢。

能夠從知識庫中準確提取相關信息回答客戶問題。

🚀 BART-LARGE在SQuADv1上微調的模型

這是一個在SQuADv1數據集上針對問答任務微調的bart-large模型，可有效用於問答場景，為自然語言處理中的問答需求提供解決方案。

🚀 快速開始

from transformers import BartTokenizer, BartForQuestionAnswering
import torch

tokenizer = BartTokenizer.from_pretrained('valhalla/bart-large-finetuned-squadv1')
model = BartForQuestionAnswering.from_pretrained('valhalla/bart-large-finetuned-squadv1')

question, text = "Who was Jim Henson?", "Jim Henson was a nice puppet"
encoding = tokenizer(question, text, return_tensors='pt')
input_ids = encoding['input_ids']
attention_mask = encoding['attention_mask']

start_scores, end_scores = model(input_ids, attention_mask=attention_mask, output_attentions=False)[:2]

all_tokens = tokenizer.convert_ids_to_tokens(input_ids[0])
answer = ' '.join(all_tokens[torch.argmax(start_scores) : torch.argmax(end_scores)+1])
answer = tokenizer.convert_tokens_to_ids(answer.split())
answer = tokenizer.decode(answer)
#answer => 'a nice puppet'

✨ 主要特性

BART是一個適用於自然語言生成（NLG）和自然語言理解（NLU）任務的序列到序列（seq2seq）模型。
可處理長達1024個標記的序列。
在問答任務中，將完整文檔輸入編碼器和解碼器，並使用解碼器的頂層隱藏狀態作為每個單詞的表示來進行標記分類。

📚 詳細文檔

模型詳情

BART在論文BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension中被提出。為了將BART用於問答任務，我們將完整文檔輸入編碼器和解碼器，並使用解碼器的頂層隱藏狀態作為每個單詞的表示，該表示用於對標記進行分類。如論文所述，bart-large在SQuAD上的表現與ROBERTa相當。