bart-squad2开源问答模型 - 免费部署实现精准抽取式问答

首页

Bart Squad2

由 primer-ai 开发

基于BART架构的抽取式问答模型，在Squad 2.0数据集上训练完成，F1得分为87.4

问答系统

Transformers

英语#抽取式问答 #高精度阅读理解 #长文本处理

下载量 18

发布时间 : 3/2/2022

模型简介

一个基于BART架构的抽取式（片段式）问答模型，专门用于回答基于给定文本的问题

模型特点

高精度问答

在Squad 2.0数据集上达到87.4的F1分数

长文本处理

支持最大1024长度的序列输入

不可回答检测

能够识别并返回无法回答的问题

模型能力

文本问答

片段提取

问题理解

使用案例

信息检索

文档问答系统

从长文档中快速提取特定问题的答案

提高信息检索效率

智能客服

FAQ自动回答

基于知识库内容自动回答用户常见问题

减少人工客服工作量

🚀 BART-Squad2

BART-Squad2 是一个用于抽取式（基于文本片段）问答任务的模型，它在Squad 2.0数据集上进行训练，能够有效从文本中提取答案，为问答系统提供了强大的支持。

🚀 快速开始

本地运行问答示例

以下是在本地运行问答的快速方法：

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained("Primer/bart-squad2")
model = AutoModelForQuestionAnswering.from_pretrained("Primer/bart-squad2")
model.to('cuda'); model.eval()

def answer(question, text):
    seq = '<s>' +  question + ' </s> </s> ' + text + ' </s>'
    tokens = tokenizer.encode_plus(seq, return_tensors='pt', padding='max_length', max_length=1024)
    input_ids = tokens['input_ids'].to('cuda')
    attention_mask = tokens['attention_mask'].to('cuda')
    start, end, _ = model(input_ids, attention_mask=attention_mask)
    start_idx = int(start.argmax().int())
    end_idx =  int(end.argmax().int())
    print(tokenizer.decode(input_ids[0, start_idx:end_idx]).strip())
    # ^^ it will be an empty string if the model decided "unanswerable"

>>> question = "Where does Tom live?"
>>> context = "Tom is an engineer in San Francisco."
>>> answer(question, context)
San Francisco

注意：如果在CPU上运行，去掉 .to('cuda') 相关代码即可。

✨ 主要特性

高准确率：在Squad 2.0数据集上训练，F1分数达到87.4。
抽取式问答：适用于抽取式（基于文本片段）的问答任务。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained("Primer/bart-squad2")
model = AutoModelForQuestionAnswering.from_pretrained("Primer/bart-squad2")
model.to('cuda'); model.eval()

def answer(question, text):
    seq = '<s>' +  question + ' </s> </s> ' + text + ' </s>'
    tokens = tokenizer.encode_plus(seq, return_tensors='pt', padding='max_length', max_length=1024)
    input_ids = tokens['input_ids'].to('cuda')
    attention_mask = tokens['attention_mask'].to('cuda')
    start, end, _ = model(input_ids, attention_mask=attention_mask)
    start_idx = int(start.argmax().int())
    end_idx =  int(end.argmax().int())
    print(tokenizer.decode(input_ids[0, start_idx:end_idx]).strip())
    # ^^ it will be an empty string if the model decided "unanswerable"

question = "Where does Tom live?"
context = "Tom is an engineer in San Francisco."
answer(question, context)