tapas-large-finetuned-wtqオープンソースのテーブル質問応答モデル - テーブルに対する自然言語の質問応答をサポート

ホーム

Tapas Large Finetuned Wtq

googleによって開発

TAPASはBERTアーキテクチャに基づく表質問応答モデルで、ウィキペディアの表データで自己監督方式により事前学習され、表内容に対する自然言語質問応答をサポート

質問応答システム

Transformers

英語オープンソースライセンス:Apache-2.0 #表質問応答システム #マルチタスクファインチューニング #数値推論

ダウンロード数 124.85k

リリース時間 : 3/2/2022

モデル概要

このモデルはウィキ表質問応答タスク(WTQ)向けに特別にファインチューニングされ、表構造を理解し関連質問に回答可能。相対位置と絶対位置の2バージョンを提供し、数値推論やセル選択などの複雑操作をサポート。

モデル特徴

二重事前学習メカニズム

マスク言語モデリング(MLM)と中間事前学習を組み合わせ、表数値推論能力を強化

マルチタスク連鎖ファインチューニング

SQA、WikiSQL、WTQの3データセットで共同ファインチューニングし、汎化能力を向上

位置埋め込みオプション

相対位置（セルリセットインデックス）と絶対位置の2種類の埋め込み方式を提供

結合予測アーキテクチャ

セル選択ヘッドと集約ヘッドを同時に訓練し、離散値と集約操作予測をサポート

モデル能力

表構造理解

自然言語質問解析

表セル選択

数値比較と計算

集約操作予測（合計、カウントなど）

使用事例

知識質問応答

ウィキペディア表質問応答

ウィキペディアのインフォボックスやデータ表に関する自然言語質問に回答

WTQ開発セットで50.97%の精度を達成

ビジネスインテリジェンス

財務諸表分析

財務諸表を解析し、収入や成長などの指標に関するクエリに回答

🚀 WikiTable Questions (WTQ)でファインチューニングされたTAPAS largeモデル

このモデルには2つのバージョンがあり、使用可能です。デフォルトのバージョンは、元のGithubリポジトリのtapas_wtq_wikisql_sqa_inter_masklm_large_resetチェックポイントに対応しています。このモデルは、MLMと著者が中間事前学習と呼ぶ追加のステップで事前学習され、その後、SQA、WikiSQL、最後にWTQの順にチェーンでファインチューニングされまし。相対位置埋め込み（つまり、テーブルの各セルで位置インデックスをリセットする）を使用しています。

使用できるもう1つの（非デフォルト）バージョンは、以下の通りです。

no_reset：tapas_wtq_wikisql_sqa_inter_masklm_large（中間事前学習、絶対位置埋め込み）に対応しています。

免責事項：TAPASをリリースしたチームはこのモデルのモデルカードを作成していないため、このモデルカードはHugging Faceチームと貢献者によって作成されました。

✨ 主な機能

🔍 結果

サイズ	リセット	開発精度	リンク
LARGE	noreset	0.5062	tapas-large-finetuned-wtq (絶対位置埋め込み)
LARGE	reset	0.5097	tapas-large-finetuned-wtq
BASE	noreset	0.4525	tapas-base-finetuned-wtq (絶対位置埋め込み)
BASE	reset	0.4638	tapas-base-finetuned-wtq
MEDIUM	noreset	0.4324	tapas-medium-finetuned-wtq (絶対位置埋め込み)
MEDIUM	reset	0.4324	tapas-medium-finetuned-wtq
SMALL	noreset	0.3681	tapas-small-finetuned-wtq (絶対位置埋め込み)
SMALL	reset	0.3762	tapas-small-finetuned-wtq
MINI	noreset	0.2783	tapas-mini-finetuned-wtq (絶対位置埋め込み)
MINI	reset	0.2854	tapas-mini-finetuned-wtq
TINY	noreset	0.0823	tapas-tiny-finetuned-wtq (絶対位置埋め込み)
TINY	reset	0.1039	tapas-tiny-finetuned-wtq

📚 モデルの説明

TAPASは、Wikipediaの大量の英語データコーパスを自己教師付き学習で事前学習したBERTのようなTransformerモデルです。これは、生のテーブルと関連するテキストのみを使用して事前学習され、人間によるラベル付けは一切行われず（このため、大量の公開データを使用できます）、それらのテキストから入力とラベルを自動生成するプロセスが行われます。より具体的には、2つの目的で事前学習されています。

マスク言語モデリング（MLM）：（平坦化された）テーブルと関連するコンテキストを取得し、モデルは入力の単語の15％をランダムにマスクし、その後、全体の（部分的にマスクされた）シーケンスをモデルに通します。モデルは、マスクされた単語を予測する必要があります。これは、通常、単語を1つずつ見る従来の再帰型ニューラルネットワーク（RNN）や、内部で未来のトークンをマスクするGPTのような自己回帰モデルとは異なります。これにより、モデルはテーブルと関連するテキストの双方向表現を学習することができます。
中間事前学習：テーブルに対する数値的推論を促進するために、著者らは数百万の構文的に作成されたトレーニング例のバランスの取れたデータセットを作成してモデルを追加で事前学習しました。ここで、モデルは、文がテーブルの内容によって支持されるか反駁されるかを予測（分類）する必要があります。トレーニング例は、合成文と反事実文に基づいて作成されます。

このようにして、モデルはテーブルと関連するテキストで使用される英語の内部表現を学習し、これを使用して、テーブルに関する質問に回答するなどの下流タスクや、文がテーブルの内容によって含意されるか反駁されるかを判断するのに役立つ特徴を抽出することができます。ファインチューニングは、事前学習されたモデルの上にセル選択ヘッドと集約ヘッドを追加し、その後、これらのランダムに初期化された分類ヘッドをベースモデルと一緒にSQa、WikiSQL、最後にWTQで共同学習することによって行われます。

🎯 想定される用途と制限

このモデルは、テーブルに関連する質問に回答するために使用できます。コード例については、HuggingFaceウェブサイトのTAPASのドキュメントを参照してください。

🔧 技術詳細

🌱 トレーニング手順

前処理

テキストは小文字に変換され、WordPieceを使用して語彙サイズ30,000でトークン化されます。モデルの入力は、次の形式になります。

[CLS] 質問 [SEP] 平坦化されたテーブル [SEP]

著者らは最初に、自動変換スクリプトを使用してWTQデータセットをSQAの形式に変換しました。

ファインチューニング

モデルは、最大シーケンス長512、バッチサイズ512で、32個のCloud TPU v3コアで50,000ステップファインチューニングされました。この設定では、ファインチューニングに約10時間かかります。使用されるオプティマイザはAdamで、学習率は1.93581e-5、ウォームアップ率は0.128960です。誘導バイアスが追加され、モデルは同じ列のセルのみを選択するようになっています。これは、TapasConfigのselect_one_columnパラメータに反映されています。詳細については、論文（表11と12）を参照してください。

📖 BibTeXエントリと引用情報

@misc{herzig2020tapas,
      title={TAPAS: Weakly Supervised Table Parsing via Pre-training}, 
      author={Jonathan Herzig and Paweł Krzysztof Nowak and Thomas Müller and Francesco Piccinno and Julian Martin Eisenschlos},
      year={2020},
      eprint={2004.02349},
      archivePrefix={arXiv},
      primaryClass={cs.IR}
}

@misc{eisenschlos2020understanding,
      title={Understanding tables with intermediate pre-training}, 
      author={Julian Martin Eisenschlos and Syrine Krichene and Thomas Müller},
      year={2020},
      eprint={2010.00571},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@article{DBLP:journals/corr/PasupatL15,
  author    = {Panupong Pasupat and
               Percy Liang},
  title     = {Compositional Semantic Parsing on Semi-Structured Tables},
  journal   = {CoRR},
  volume    = {abs/1508.00305},
  year      = {2015},
  url       = {http://arxiv.org/abs/1508.00305},
  archivePrefix = {arXiv},
  eprint    = {1508.00305},
  timestamp = {Mon, 13 Aug 2018 16:47:37 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/PasupatL15.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}