flan - t5 - large - squad2オープンソース質疑応答モデル - 回答可能と回答不可能な質問を精度よく処理

ホーム

Flan T5 Large Squad2

sjrhuschleeによって開発

flan-t5-largeモデルをベースに、SQuAD2.0データセットでファインチューニングした抽出型QAモデルで、回答可能・不可能な質問の処理に対応しています。

質問応答システム

Transformers

英語オープンソースライセンス:MIT #抽出型QA #LoRAファインチューニング #SQuAD2.0対応

ダウンロード数 57

リリース時間 : 6/14/2023

モデル概要

このモデルは英語の抽出型QAタスク向けに最適化されており、特にSQuAD2.0データセットに含まれる回答可能・不可能な質問ペアを処理できます。

モデル特徴

LoRAファインチューニング技術

PEFTライブラリのLoRA技術を使用した効率的なファインチューニングにより、モデル性能を維持しながら計算リソース要件を削減

特殊トークン処理

'無回答'ケースを予測するために<cls>トークンを使用し、回答不可能な質問を効果的に処理

複数データセット検証

SQuAD、SQuAD2.0および複数の敵対的データセットで包括的な検証を実施

モデル能力

抽出型質問応答

無回答検出

文脈理解

使用事例

インテリジェントカスタマーサポート

FAQ自動応答

ナレッジベースの内容に基づいてユーザーのよくある質問に自動回答

SQuAD2.0検証セットで86.8%の正確一致率を達成

教育

読解支援

学生が文章を理解し関連質問に回答するのを支援

SQuAD検証セットでF1値95.06を達成

🚀 flan-t5-large for Extractive QA

このモデルは、SQuAD2.0 データセットを使用して微調整された flan-t5-large モデルです。抽出型質問応答タスクのために、回答不能な質問を含む質問-回答ペアで訓練されています。

更新: Transformersバージョン4.31.0以降では、use_remote_code=True は不要になりました。

このモデルは、PEFTライブラリを通じて利用可能なLoRAを使用して訓練されています。

注意: このモデルを適切に動作させるには、質問の先頭に <cls> トークンを手動で追加する必要があります。このモデルは <cls> トークンを使用して「回答なし」の予測を行います。t5トークナイザーはこの特殊トークンを自動的に追加しないため、手動で追加する必要があります。

🚀 クイックスタート

このモデルは、抽出型質問応答タスクに特化した flan-t5-large モデルです。以下に、モデルの使用方法や評価指標などの詳細を説明します。

✨ 主な機能

抽出型質問応答: 質問に対する回答を文章から抽出することができます。
回答不能な質問に対応: <cls> トークンを使用して、回答不能な質問に対して「回答なし」の予測を行うことができます。
LoRAを使用した訓練: PEFTライブラリを通じてLoRAを使用して訓練されており、効率的な微調整が可能です。

📋 概要

属性	詳情
言語モデル	flan-t5-large
言語	英語
下流タスク	抽出型質問応答
訓練データ	SQuAD 2.0
評価データ	SQuAD 2.0
インフラストラクチャ	1x NVIDIA 3070

💻 使用例

基本的な使用法

このコードは、マージされた重み（ベースモデルの重み + LoRAの重み）を使用して、Transformersパイプラインで簡単に使用できるようにしています。PEFTライブラリを使用して重みを個別に使用する場合と同じパフォーマンスを発揮します。

import torch
from transformers import(
  AutoModelForQuestionAnswering,
  AutoTokenizer,
  pipeline
)
model_name = "sjrhuschlee/flan-t5-large-squad2"

# a) Using pipelines
nlp = pipeline(
  'question-answering',
  model=model_name,
  tokenizer=model_name,
  # trust_remote_code=True, # Do not use if version transformers>=4.31.0
)
qa_input = {
'question': f'{nlp.tokenizer.cls_token}Where do I live?',  # '<cls>Where do I live?'
'context': 'My name is Sarah and I live in London'
}
res = nlp(qa_input)
# {'score': 0.984, 'start': 30, 'end': 37, 'answer': ' London'}

# b) Load model & tokenizer
model = AutoModelForQuestionAnswering.from_pretrained(
  model_name,
  # trust_remote_code=True # Do not use if version transformers>=4.31.0
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

question = f'{tokenizer.cls_token}Where do I live?'  # '<cls>Where do I live?'
context = 'My name is Sarah and I live in London'
encoding = tokenizer(question, context, return_tensors="pt")
output = model(
  encoding["input_ids"],
  attention_mask=encoding["attention_mask"]
)

all_tokens = tokenizer.convert_ids_to_tokens(encoding["input_ids"][0].tolist())
answer_tokens = all_tokens[torch.argmax(output["start_logits"]):torch.argmax(output["end_logits"]) + 1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))
# 'London'

高度な使用法

注意: これには、PEFTライブラリのPR https://github.com/huggingface/peft/pull/473 のコードが必要です。

#!pip install peft

from peft import LoraConfig, PeftModelForQuestionAnswering
from transformers import AutoModelForQuestionAnswering, AutoTokenizer
model_name = "sjrhuschlee/flan-t5-large-squad2"

📚 ドキュメント

評価指標

# Squad v2
{
    "eval_HasAns_exact": 85.08771929824562,
    "eval_HasAns_f1": 90.598422845031,
    "eval_HasAns_total": 5928,
    "eval_NoAns_exact": 88.47771236333053,
    "eval_NoAns_f1": 88.47771236333053,
    "eval_NoAns_total": 5945,
    "eval_best_exact": 86.78514276088605,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 89.53654936623764,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 86.78514276088605,
    "eval_f1": 89.53654936623776,
    "eval_runtime": 1908.3189,
    "eval_samples": 12001,
    "eval_samples_per_second": 6.289,
    "eval_steps_per_second": 0.787,
    "eval_total": 11873
}

# Squad
{
    "eval_HasAns_exact": 85.99810785241249,
    "eval_HasAns_f1": 91.296119057944,
    "eval_HasAns_total": 10570,
    "eval_best_exact": 85.99810785241249,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 91.296119057944,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 85.99810785241249,
    "eval_f1": 91.296119057944,
    "eval_runtime": 1508.9596,
    "eval_samples": 10657,
    "eval_samples_per_second": 7.062,
    "eval_steps_per_second": 0.883,
    "eval_total": 10570
}