longformer-base-4096-finetuned-squadv2開源問答模型

首頁

Longformer Base 4096 Finetuned Squadv2

由mrm8488開發

該模型是基於Longformer架構，在SQuAD v2問答數據集上微調的問答系統，支持處理長文本序列（最長4096個token）。

問答系統

Transformers

英語#長文本問答 #SQuADv2微調 #4096上下文窗口

下載量 190

發布時間 : 3/2/2022

模型概述

Longformer-base-4096是一個專為長文檔設計的Transformer模型，基於RoBERTa初始化，並在SQuAD v2數據集上進行了問答任務微調。它結合了滑動窗口局部注意力和全局注意力機制，適合處理長文檔問答任務。

模型特點

長文本處理能力

支持最長4096個token的序列，適合處理長文檔問答任務

混合注意力機制

結合滑動窗口局部注意力和全局注意力，在保持效率的同時捕捉長距離依賴關係

高精度問答

在SQuAD v2驗證集上達到79.92%的精確匹配率和83.35%的F1分數

模型能力

長文本問答

開放域問答

無答案檢測

使用案例

文檔問答系統

法律文檔分析

從長法律文檔中提取特定問題的答案

研究報告問答

回答關於學術論文或技術報告的問題

客戶支持

FAQ自動回答

從長產品文檔中回答客戶問題

🚀 Longformer-base-4096在SQuAD v2上微調

本項目是將 Longformer-base-4096模型在 SQuAD v2 數據集上進行微調，以用於**問答（Q&A）**下游任務。

✨ 主要特性

適用於長文檔：Longformer 是一種用於處理長文檔的Transformer模型。longformer-base-4096 是一個類似BERT的模型，它基於RoBERTa的檢查點，並在長文檔上進行了掩碼語言模型（MLM）預訓練，支持長度達4096的序列。
獨特的注意力機制：Longformer結合了滑動窗口（局部）注意力和全局注意力。全局注意力可根據任務進行用戶配置，使模型能夠學習特定任務的表示。

📦 安裝指南

若要從 datasets 加載數據集，可按以下步驟操作：

!pip install datasets
from datasets import load_dataset
dataset = load_dataset('squad_v2')

💻 使用示例

基礎用法

以下是使用該模型進行問答任務的示例代碼：

import torch
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
ckpt = "mrm8488/longformer-base-4096-finetuned-squadv2"
tokenizer = AutoTokenizer.from_pretrained(ckpt)
model = AutoModelForQuestionAnswering.from_pretrained(ckpt)

text = "Huggingface has democratized NLP. Huge thanks to Huggingface for this."
question = "What has Huggingface done ?"
encoding = tokenizer(question, text, return_tensors="pt")
input_ids = encoding["input_ids"]

# default is local attention everywhere
# the forward method will automatically set global attention on question tokens
attention_mask = encoding["attention_mask"]

start_scores, end_scores = model(input_ids, attention_mask=attention_mask)
all_tokens = tokenizer.convert_ids_to_tokens(input_ids[0].tolist())

answer_tokens = all_tokens[torch.argmax(start_scores) :torch.argmax(end_scores)+1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))

# output => democratized NLP

高級用法

使用HF pipleine 進行問答任務：

from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline

ckpt = "mrm8488/longformer-base-4096-finetuned-squadv2"
tokenizer = AutoTokenizer.from_pretrained(ckpt)
model = AutoModelForQuestionAnswering.from_pretrained(ckpt)

qa = pipeline("question-answering", model=model, tokenizer=tokenizer)

text = "Huggingface has democratized NLP. Huge thanks to Huggingface for this."
question = "What has Huggingface done?"

qa({"question": question, "context": text})

如果在給定的上下文中詢問不存在的內容，無答案的輸出將是 <s>。