bart-large-finetuned-squadv1开源模型 - 免费部署助力自然语言问答与生成

首页

Bart Large Finetuned Squadv1

由 valhalla 开发

这是一个针对问答任务在SQuADv1数据集上微调的BART-LARGE模型，适用于自然语言理解和生成任务。

问答系统 #长文本问答 #高精度阅读理解 #序列到序列架构

下载量 959

发布时间 : 3/2/2022

模型简介

该模型是基于BART架构的序列到序列模型，专门针对问答任务进行了微调，能够处理长达1024个标记的序列。

模型特点

长序列处理能力

能够处理长达1024个标记的序列，适合处理较长文档的问答任务。

双向编码器-解码器架构

结合了双向编码器和自回归解码器的优势，适用于理解和生成任务。

高性能问答能力

在SQuADv1数据集上表现优异，F1值达到92.7。

模型能力

文本理解

问答系统

自然语言处理

使用案例

教育

自动问答系统

用于教育领域的自动问答系统，回答学生提出的问题。

能够准确理解问题并从文档中提取相关答案。

客户服务

智能客服

用于客户服务中的自动问答，快速响应客户咨询。

能够从知识库中准确提取相关信息回答客户问题。

🚀 BART-LARGE在SQuADv1上微调的模型

这是一个在SQuADv1数据集上针对问答任务微调的bart-large模型，可有效用于问答场景，为自然语言处理中的问答需求提供解决方案。

🚀 快速开始

from transformers import BartTokenizer, BartForQuestionAnswering
import torch

tokenizer = BartTokenizer.from_pretrained('valhalla/bart-large-finetuned-squadv1')
model = BartForQuestionAnswering.from_pretrained('valhalla/bart-large-finetuned-squadv1')

question, text = "Who was Jim Henson?", "Jim Henson was a nice puppet"
encoding = tokenizer(question, text, return_tensors='pt')
input_ids = encoding['input_ids']
attention_mask = encoding['attention_mask']

start_scores, end_scores = model(input_ids, attention_mask=attention_mask, output_attentions=False)[:2]

all_tokens = tokenizer.convert_ids_to_tokens(input_ids[0])
answer = ' '.join(all_tokens[torch.argmax(start_scores) : torch.argmax(end_scores)+1])
answer = tokenizer.convert_tokens_to_ids(answer.split())
answer = tokenizer.decode(answer)
#answer => 'a nice puppet'

✨ 主要特性

BART是一个适用于自然语言生成（NLG）和自然语言理解（NLU）任务的序列到序列（seq2seq）模型。
可处理长达1024个标记的序列。
在问答任务中，将完整文档输入编码器和解码器，并使用解码器的顶层隐藏状态作为每个单词的表示来进行标记分类。

📚 详细文档

模型详情

BART在论文BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension中被提出。为了将BART用于问答任务，我们将完整文档输入编码器和解码器，并使用解码器的顶层隐藏状态作为每个单词的表示，该表示用于对标记进行分类。如论文所述，bart-large在SQuAD上的表现与ROBERTa相当。