bart-squad2開源問答模型 - 免費部署實現精準抽取式問答

首頁

Bart Squad2

由primer-ai開發

基於BART架構的抽取式問答模型，在Squad 2.0數據集上訓練完成，F1得分為87.4

問答系統

Transformers

英語#抽取式問答 #高精度閱讀理解 #長文本處理

下載量 18

發布時間 : 3/2/2022

模型概述

一個基於BART架構的抽取式（片段式）問答模型，專門用於回答基於給定文本的問題

模型特點

高精度問答

在Squad 2.0數據集上達到87.4的F1分數

長文本處理

支持最大1024長度的序列輸入

不可回答檢測

能夠識別並返回無法回答的問題

模型能力

文本問答

片段提取

問題理解

使用案例

信息檢索

文檔問答系統

從長文檔中快速提取特定問題的答案

提高信息檢索效率

智能客服

FAQ自動回答

基於知識庫內容自動回答用戶常見問題

減少人工客服工作量

🚀 BART-Squad2

BART-Squad2 是一個用於抽取式（基於文本片段）問答任務的模型，它在Squad 2.0數據集上進行訓練，能夠有效從文本中提取答案，為問答系統提供了強大的支持。

🚀 快速開始

本地運行問答示例

以下是在本地運行問答的快速方法：

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained("Primer/bart-squad2")
model = AutoModelForQuestionAnswering.from_pretrained("Primer/bart-squad2")
model.to('cuda'); model.eval()

def answer(question, text):
    seq = '<s>' +  question + ' </s> </s> ' + text + ' </s>'
    tokens = tokenizer.encode_plus(seq, return_tensors='pt', padding='max_length', max_length=1024)
    input_ids = tokens['input_ids'].to('cuda')
    attention_mask = tokens['attention_mask'].to('cuda')
    start, end, _ = model(input_ids, attention_mask=attention_mask)
    start_idx = int(start.argmax().int())
    end_idx =  int(end.argmax().int())
    print(tokenizer.decode(input_ids[0, start_idx:end_idx]).strip())
    # ^^ it will be an empty string if the model decided "unanswerable"

>>> question = "Where does Tom live?"
>>> context = "Tom is an engineer in San Francisco."
>>> answer(question, context)
San Francisco

注意：如果在CPU上運行，去掉 .to('cuda') 相關代碼即可。

✨ 主要特性

高準確率：在Squad 2.0數據集上訓練，F1分數達到87.4。
抽取式問答：適用於抽取式（基於文本片段）的問答任務。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelForQuestionAnswering

tokenizer = AutoTokenizer.from_pretrained("Primer/bart-squad2")
model = AutoModelForQuestionAnswering.from_pretrained("Primer/bart-squad2")
model.to('cuda'); model.eval()

def answer(question, text):
    seq = '<s>' +  question + ' </s> </s> ' + text + ' </s>'
    tokens = tokenizer.encode_plus(seq, return_tensors='pt', padding='max_length', max_length=1024)
    input_ids = tokens['input_ids'].to('cuda')
    attention_mask = tokens['attention_mask'].to('cuda')
    start, end, _ = model(input_ids, attention_mask=attention_mask)
    start_idx = int(start.argmax().int())
    end_idx =  int(end.argmax().int())
    print(tokenizer.decode(input_ids[0, start_idx:end_idx]).strip())
    # ^^ it will be an empty string if the model decided "unanswerable"

question = "Where does Tom live?"
context = "Tom is an engineer in San Francisco."
answer(question, context)