flan-t5-base-squad2オープンソース質問応答モデル - 無解答の質問応答ペアを含む処理を無料でデプロイ可能

ホーム

Flan T5 Base Squad2

sjrhuschleeによって開発

flan-t5-baseモデルをベースに、SQuAD2.0データセットでファインチューニングされた抽出型質問応答モデルで、無回答を含む質問ペアを処理可能

質問応答システム

Transformers

英語オープンソースライセンス:MIT #抽出型質問応答 #無回答検出 #SQuAD2.0ファインチューニング

ダウンロード数 2,425

リリース時間 : 6/14/2023

モデル概要

このモデルは英語の抽出型質問応答タスク専用で、特にSQuAD2.0データセットの質問処理に優れており、無回答ケースの判定も可能

モデル特徴

無回答問題処理

特殊<cls>マーカーで無回答ケースを識別、SQuAD2.0データセットに特化して最適化

複数データセット適応

SQuAD、SQuAD2.0及びその派生データセットで良好な性能を発揮

効率的な推論

単一のNVIDIA 3070 GPUで動作可能

モデル能力

抽出型質問応答

無回答検出

英語テキスト理解

使用事例

インテリジェントカスタマーサポート

FAQ回答

ナレッジベースから正確な回答を抽出してユーザー質問に回答

SQuAD検証セットで86.37%の正確一致率を達成

教育支援

読解力評価

生徒の文章理解度を評価

SQuAD2.0検証セットでF1スコア85.28を達成

🚀 flan-t5-base for Extractive QA

このモデルは、SQuAD2.0 データセットを使用して微調整された flan-t5-base モデルです。抽出型質問応答タスクのために、回答不能な質問を含む質問-回答ペアで訓練されています。

🚀 クイックスタート

モデル概要

属性	详情
言語モデル	flan-t5-base
言語	英語
下流タスク	抽出型質問応答
訓練データ	SQuAD 2.0
評価データ	SQuAD 2.0
インフラストラクチャ	1x NVIDIA 3070

モデルの使用方法

import torch
from transformers import(
  AutoModelForQuestionAnswering,
  AutoTokenizer,
  pipeline
)
model_name = "sjrhuschlee/flan-t5-base-squad2"

# a) パイプラインを使用する場合
nlp = pipeline(
  'question-answering',
  model=model_name,
  tokenizer=model_name,
  # trust_remote_code=True, # Do not use if version transformers>=4.31.0
)
qa_input = {
'question': f'{nlp.tokenizer.cls_token}Where do I live?',  # '<cls>Where do I live?'
'context': 'My name is Sarah and I live in London'
}
res = nlp(qa_input)
# {'score': 0.980, 'start': 30, 'end': 37, 'answer': ' London'}

# b) モデルとトークナイザーをロードする場合
model = AutoModelForQuestionAnswering.from_pretrained(
  model_name,
  # trust_remote_code=True # Do not use if version transformers>=4.31.0
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

question = f'{tokenizer.cls_token}Where do I live?'  # '<cls>Where do I live?'
context = 'My name is Sarah and I live in London'
encoding = tokenizer(question, context, return_tensors="pt")
output = model(
  encoding["input_ids"],
  attention_mask=encoding["attention_mask"]
)

all_tokens = tokenizer.convert_ids_to_tokens(encoding["input_ids"][0].tolist())
answer_tokens = all_tokens[torch.argmax(output["start_logits"]):torch.argmax(output["end_logits"]) + 1]
answer = tokenizer.decode(tokenizer.convert_tokens_to_ids(answer_tokens))
# 'London'

重要な注意事項

⚠️ 重要提示

このモデルを正常に動作させるには、質問の先頭に <cls> トークンを手動で追加する必要があります。このトークンは、「回答なし」の予測を行うために使用されます。t5トークナイザーはこの特殊トークンを自動的に追加しないため、手動で追加する必要があります。

💡 使用建议

transformersバージョンが4.31.0以上の場合は、trust_remote_code=True を使用しないでください。

✨ 主な機能

このモデルは、抽出型質問応答タスクに特化しており、回答不能な質問にも対応できます。

📚 ドキュメント

評価指標

# Squad v2
{
    "eval_HasAns_exact": 79.97638326585695,
    "eval_HasAns_f1": 86.1444296592862,
    "eval_HasAns_total": 5928,
    "eval_NoAns_exact": 84.42388561816652,
    "eval_NoAns_f1": 84.42388561816652,
    "eval_NoAns_total": 5945,
    "eval_best_exact": 82.2033184536343,
    "eval_best_exact_thresh": 0.0,
    "eval_best_f1": 85.28292588395921,
    "eval_best_f1_thresh": 0.0,
    "eval_exact": 82.2033184536343,
    "eval_f1": 85.28292588395928,
    "eval_runtime": 522.0299,
    "eval_samples": 12001,
    "eval_samples_per_second": 22.989,
    "eval_steps_per_second": 0.96,
    "eval_total": 11873
}

# Squad
{
    "eval_exact_match": 86.3197729422895,
    "eval_f1": 92.94686836210295,
    "eval_runtime": 442.1088,
    "eval_samples": 10657,
    "eval_samples_per_second": 24.105,
    "eval_steps_per_second": 1.007
}