tapas-large-finetuned-sqaオープンソースモデル - 表に関する質問応答の難題を解決、無料でデプロイして楽に利用

ホーム

Tapas Large Finetuned Sqa

googleによって開発

このモデルはTAPASの大型バージョンで、順序質問応答(SQA)タスクでファインチューニングされ、表関連の質問応答シーンに適しています。

質問応答システム

Transformers

英語オープンソースライセンス:Apache-2.0 #表形式の質問応答 #多輪対話 #数値推論

ダウンロード数 71

リリース時間 : 3/2/2022

モデル概要

TAPASはBERTに似たTransformerモデルで、表データと関連テキストの質問応答タスクを専門に処理します。このモデルはウィキペディアの英語表データで事前学習され、SQAデータセットでファインチューニングされています。

モデル特徴

表形式の質問応答能力

表データを対象に特別に設計された質問応答モデルで、表の構造と内容を理解できます。

順序質問応答のサポート

対話シーンでの順序質問応答をサポートし、相互に関連する一連の質問を処理できます。

二段階学習

まずマスク言語モデリングの事前学習を行い、次に数値推論能力を強化するための中間事前学習を行います。

モデル能力

表の理解

順序質問応答

数値推論

テキスト - 表関連分析

使用事例

ビジネスインテリジェンス

財務諸表分析

財務諸表データに関する様々な質問に自動的に回答します。

SQAデータセットで72.89%の正解率を達成しました。

カスタマーサービス

製品情報照会

製品仕様表に基づいて顧客の照会に回答します。

🚀 TAPAS largeモデル：Sequential Question Answering (SQA)でファインチューニング済み

このモデルには2つのバージョンがあり、利用可能です。デフォルトのバージョンは、元のGitHubリポジトリの tapas_sqa_inter_masklm_large_reset チェックポイントに対応しています。このモデルは、MLMと著者が中間事前学習と呼ぶ追加のステップで事前学習され、その後 SQA でファインチューニングされました。相対位置埋め込み（つまり、テーブルの各セルで位置インデックスをリセットする）を使用しています。

使用できるもう1つの（非デフォルト）バージョンは次の通りです。

no_reset：tapas_sqa_inter_masklm_large（中間事前学習、絶対位置埋め込み）に対応しています。

免責事項：TAPASをリリースしたチームはこのモデルのモデルカードを作成していないため、このモデルカードはHugging Faceチームと貢献者によって作成されました。

🚀 クイックスタート

このモデルは、会話形式でテーブルに関連する質問に回答するために使用できます。コード例については、HuggingFaceウェブサイトのTAPASのドキュメントを参照してください。

✨ 主な機能

このモデルには2つのバージョンがあり、それぞれ異なる事前学習と位置埋め込み方法を持っています。
デフォルトのバージョンは相対位置埋め込みを使用し、非デフォルトのバージョンは絶対位置埋め込みを使用します。
事前学習には、Masked language modeling (MLM) と中間事前学習の2つの目的があり、テーブルと関連テキストの双方向表現を学習します。

📚 ドキュメント

SQA - Dev Accuracyの結果

サイズ	リセット	Dev Accuracy	リンク
LARGE	noreset	0.7223	tapas-large-finetuned-sqa (絶対位置埋め込み)
LARGE	reset	0.7289	tapas-large-finetuned-sqa
BASE	noreset	0.6737	tapas-base-finetuned-sqa (絶対位置埋め込み)
BASE	reset	0.874	tapas-base-finetuned-sqa
MEDIUM	noreset	0.6464	tapas-medium-finetuned-sqa (絶対位置埋め込み)
MEDIUM	reset	0.6561	tapas-medium-finetuned-sqa
SMALL	noreset	0.5876	tapas-small-finetuned-sqa (絶対位置埋め込み)
SMALL	reset	0.6155	tapas-small-finetuned-sqa
MINI	noreset	0.4574	tapas-mini-finetuned-sqa (絶対位置埋め込み)
MINI	reset	0.5148	tapas-mini-finetuned-sqa
TINY	noreset	0.2004	tapas-tiny-finetuned-sqa (絶対位置埋め込み)
TINY	reset	0.2375	tapas-tiny-finetuned-sqa

モデルの説明

TAPASは、Wikipediaの大量の英語データコーパスを自己教師付き方式で事前学習したBERTのようなトランスフォーマーモデルです。つまり、生のテーブルと関連テキストのみを使用して事前学習され、人間によるラベル付けは一切行われず（このため、大量の公開データを使用できます）、それらのテキストから入力とラベルを自動生成するプロセスが行われます。より正確には、2つの目的で事前学習されています。

Masked language modeling (MLM)：（平坦化した）テーブルと関連するコンテキストを取得し、モデルは入力内の単語の15％をランダムにマスクし、その後、全体の（部分的にマスクされた）シーケンスをモデルに通します。モデルはマスクされた単語を予測する必要があります。これは、通常は単語を1つずつ見る従来の再帰型ニューラルネットワーク（RNN）や、内部で未来のトークンをマスクするGPTのような自己回帰モデルとは異なります。これにより、モデルはテーブルと関連テキストの双方向表現を学習することができます。
中間事前学習：テーブルに関する数値推論を促進するために、著者らは数百万の構文的に作成された学習例のバランスの取れたデータセットを作成してモデルを追加で事前学習しました。ここでは、モデルは文がテーブルの内容によって支持されるか反駁されるかを予測（分類）する必要があります。学習例は、合成文と反事実文の両方に基づいて作成されます。

このようにして、モデルはテーブルと関連テキストで使用される英語の内部表現を学習し、これを使用して、テーブルに関する質問に回答するなどの下流タスクや、文がテーブルの内容によって含意されるか反駁されるかを判断するために有用な特徴を抽出することができます。ファインチューニングは、事前学習済みモデルの上にセル選択ヘッドを追加し、その後、このランダムに初期化された分類ヘッドをベースモデルと一緒にSQAで共同学習することによって行われます。

想定される用途と制限

トレーニング手順

前処理

テキストは小文字に変換され、WordPieceを使用してトークン化され、語彙サイズは30,000です。モデルの入力は次の形式になります。

[CLS] 質問 [SEP] 平坦化したテーブル [SEP]

ファインチューニング

モデルは、32個のCloud TPU v3コアで200,000ステップ、最大シーケンス長512、バッチサイズ128でファインチューニングされました。この設定では、ファインチューニングに約20時間かかります。使用されるオプティマイザはAdamで、学習率は1.25e-5、ウォームアップ率は0.2です。誘導バイアスが追加され、モデルは同じ列のセルのみを選択するようになっています。これは、TapasConfig の select_one_column パラメータに反映されています。詳細は、元の論文の表12も参照してください。

BibTeXエントリと引用情報

@misc{herzig2020tapas,
      title={TAPAS: Weakly Supervised Table Parsing via Pre-training}, 
      author={Jonathan Herzig and Paweł Krzysztof Nowak and Thomas Müller and Francesco Piccinno and Julian Martin Eisenschlos},
      year={2020},
      eprint={2004.02349},
      archivePrefix={arXiv},
      primaryClass={cs.IR}
}

@misc{eisenschlos2020understanding,
      title={Understanding tables with intermediate pre-training}, 
      author={Julian Martin Eisenschlos and Syrine Krichene and Thomas Müller},
      year={2020},
      eprint={2010.00571},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@InProceedings{iyyer2017search-based,
author = {Iyyer, Mohit and Yih, Scott Wen-tau and Chang, Ming-Wei},
title = {Search-based Neural Structured Learning for Sequential Question Answering},
booktitle = {Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics},
year = {2017},
month = {July},
abstract = {Recent work in semantic parsing for question answering has focused on long and complicated questions, many of which would seem unnatural if asked in a normal conversation between two humans. In an effort to explore a conversational QA setting, we present a more realistic task: answering sequences of simple but inter-related questions. We collect a dataset of 6,066 question sequences that inquire about semi-structured tables from Wikipedia, with 17,553 question-answer pairs in total. To solve this sequential question answering task, we propose a novel dynamic neural semantic parsing framework trained using a weakly supervised reward-guided search. Our model effectively leverages the sequential context to outperform state-of-the-art QA systems that are designed to answer highly complex questions.},
publisher = {Association for Computational Linguistics},
url = {https://www.microsoft.com/en-us/research/publication/search-based-neural-structured-learning-sequential-question-answering/},
}