tapas-temporary-repoオープンソースの表形式質問応答モデル - 表データを簡単に処理する対話型質問応答タスク

ホーム

Tapas Temporary Repo

lysandreによって開発

TAPASは表形式データの対話型質問応答タスクを処理するために事前学習とファインチューニングを行った表ベースの質問応答モデルです。

質問応答システム

Transformers

英語オープンソースライセンス:Apache-2.0 #表形式質問応答 #対話型インタラクション #数値推論

ダウンロード数 3,443

リリース時間 : 3/2/2022

モデル概要

このモデルはTAPASのバリエーションで、特に逐次質問応答（SQA）タスク向けにファインチューニングされており、表の内容を理解して関連する質問に答えることができます。

モデル特徴

表理解能力

事前学習を通じて表の構造と内容の内在的表現を学習

逐次質問応答サポート

対話型の逐次質問応答シナリオ向けに最適化

マルチバージョンサポート

4種類の異なる事前学習方式のモデルバージョンを提供

モデル能力

表内容理解

逐次質問回答

表データ推論

使用事例

インテリジェントカスタマーサポート

表データクエリ

ユーザーの表データに関する連続した質問に回答

表の内容を正確に理解し関連する回答を提供

データ分析

データ探索

自然言語インタラクションを通じて表データを探索

ユーザーが表中のキー情報を迅速に取得するのを支援

🚀 TAPASベースモデル（Sequential Question Answering (SQA)でファインチューニング済み）

このモデルには4つのバージョンがあり、使用可能です。最新バージョン（デフォルト）は、元のGitHubリポジトリのtapas_sqa_inter_masklm_base_resetチェックポイントに対応しています。このモデルは、MLMと著者が中間事前学習と呼ぶ追加のステップで事前学習され、その後Sequential Question Answering (SQA)でファインチューニングされまし。デフォルトでは相対位置埋め込みを使用しています（つまり、テーブルの各セルで位置インデックスをリセットします）。

使用可能な他の（非デフォルト）バージョンは以下の通りです。

revision="v3"：tapas_sqa_inter_masklm_base（中間事前学習、絶対位置埋め込み）に対応
revision="V2"：tapas_sqa_masklm_base_reset（中間事前学習なし、相対位置埋め込み）に対応
revision="v1"：tapas_sqa_masklm_base（中間事前学習なし、絶対位置埋め込み）に対応

免責事項：TAPASをリリースしたチームはこのモデルのモデルカードを作成していないため、このモデルカードはHugging Faceチームとコントリビューターによって作成されました。

🚀 クイックスタート

このモデルは、会話形式でテーブルに関連する質問に答えるために使用できます。コード例については、Hugging FaceのウェブサイトのTAPASのドキュメントを参照してください。

✨ 主な機能

モデルの説明

TAPASは、Wikipediaの大量の英語データコーパスを自己教師付き方式で事前学習したBERTライクなTransformerモデルです。つまり、生のテーブルと関連するテキストのみを使用して事前学習され、人間によるラベル付けは一切行われず（このため、多くの公開データを利用できます）、それらのテキストから入力とラベルを自動的に生成するプロセスが行われます。具体的には、2つの目的で事前学習されています。

マスク言語モデリング（MLM）：（平坦化された）テーブルと関連するコンテキストを入力として、モデルは入力中の単語の15％をランダムにマスクし、その後、全体の（部分的にマスクされた）シーケンスをモデルに通します。モデルはその後、マスクされた単語を予測する必要があります。これは、通常は単語を順番に見る従来の再帰型ニューラルネットワーク（RNN）や、内部的に未来のトークンをマスクするGPTのような自己回帰モデルとは異なります。これにより、モデルはテーブルと関連するテキストの双方向表現を学習することができます。
中間事前学習：テーブルに対する数値的推論を促進するために、著者らは数百万の構文的に作成されたトレーニング例のバランスの取れたデータセットを作成してモデルを事前学習させました。ここでは、モデルは文がテーブルの内容によって支持されるか反駁されるかを予測（分類）する必要があります。トレーニング例は、合成文と反事実文に基づいて作成されます。

このようにして、モデルはテーブルと関連するテキストで使用される英語の内部表現を学習し、これを使用して、テーブルに関する質問に答える、または文がテーブルの内容によって含意されるか反駁されるかを判断するなどの下流タスクに役立つ特徴を抽出することができます。ファインチューニングは、事前学習されたモデルの上にセル選択ヘッドを追加し、その後、このランダムに初期化された分類ヘッドをベースモデルと一緒にSQAで共同学習することによって行われます。

トレーニング手順

前処理

テキストは小文字に変換され、WordPieceを使用して語彙サイズ30,000でトークン化されます。モデルの入力は次の形式になります。

[CLS] 質問 [SEP] 平坦化されたテーブル [SEP]

ファインチューニング

モデルは、最大シーケンス長512、バッチサイズ128で、32個のCloud TPU v3コア上で200,000ステップのファインチューニングが行われまし。この設定では、ファインチューニングに約20時間かかります。使用されるオプティマイザはAdamで、学習率は1.25e-5、ウォームアップ率は0.2です。また、モデルが同じ列のセルのみを選択するように誘導的バイアスが追加されています。これはTapasConfigのselect_one_columnパラメータに反映されています。詳細は元の論文の表12を参照してください。

引用情報

@misc{herzig2020tapas,
      title={TAPAS: Weakly Supervised Table Parsing via Pre-training}, 
      author={Jonathan Herzig and Paweł Krzysztof Nowak and Thomas Müller and Francesco Piccinno and Julian Martin Eisenschlos},
      year={2020},
      eprint={2004.02349},
      archivePrefix={arXiv},
      primaryClass={cs.IR}
}

@misc{eisenschlos2020understanding,
      title={Understanding tables with intermediate pre-training}, 
      author={Julian Martin Eisenschlos and Syrine Krichene and Thomas Müller},
      year={2020},
      eprint={2010.00571},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@InProceedings{iyyer2017search-based,
author = {Iyyer, Mohit and Yih, Scott Wen-tau and Chang, Ming-Wei},
title = {Search-based Neural Structured Learning for Sequential Question Answering},
booktitle = {Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics},
year = {2017},
month = {July},
abstract = {Recent work in semantic parsing for question answering has focused on long and complicated questions, many of which would seem unnatural if asked in a normal conversation between two humans. In an effort to explore a conversational QA setting, we present a more realistic task: answering sequences of simple but inter-related questions. We collect a dataset of 6,066 question sequences that inquire about semi-structured tables from Wikipedia, with 17,553 question-answer pairs in total. To solve this sequential question answering task, we propose a novel dynamic neural semantic parsing framework trained using a weakly supervised reward-guided search. Our model effectively leverages the sequential context to outperform state-of-the-art QA systems that are designed to answer highly complex questions.},
publisher = {Association for Computational Linguistics},
url = {https://www.microsoft.com/en-us/research/publication/search-based-neural-structured-learning-sequential-question-answering/},
}