🚀 TAPEX (大型モデル)
TAPEXは、Qian Liu、Bei Chen、Jiaqi Guo、Morteza Ziyadi、Zeqi Lin、Weizhu Chen、Jian - Guang Louによる「TAPEX: Table Pre - training via Learning a Neural SQL Executor」で提案されました。元のリポジトリは[こちら](https://github.com/microsoft/Table - Pretraining)です。
🚀 クイックスタート
TAPEXは、既存のモデルに表推論能力を付与するための、概念的にシンプルで実証的に強力な事前学習アプローチです。このモデルは、自動合成された実行可能なSQLクエリから得られる合成コーパス上でニューラルSQLエグゼキュータを学習することで、表の事前学習を実現します。
✨ 主な機能
TAPEX(Table Pre - training via Execution)は、既存のモデルに表推論のスキルを付与するための、概念的にシンプルで実証的に強力な事前学習アプローチです。TAPEXは、自動合成された実行可能なSQLクエリから得られる合成コーパス上でニューラルSQLエグゼキュータを学習することで、表の事前学習を実現します。
TAPEXは、双方向(BERTのような)エンコーダと自己回帰(GPTのような)デコーダを持つトランスフォーマーエンコーダ・デコーダ(seq2seq)モデルであるBARTアーキテクチャに基づいています。
このモデルは、WikiTableQuestionsデータセットでファインチューニングされたtapex - base
モデルです。
📚 ドキュメント
想定される使用方法
このモデルは、複雑な質問に対する表質問応答に使用できます。いくつかの解決可能な質問を以下に示します(対応する表は表示していません)。
質問 |
回答 |
表によると、Spicy Horseが制作した最後のタイトルは何ですか? |
Akaneiro: Demon Hunters |
Coleraine Academical InstitutionとRoyal School Dungannonの準優勝者の差は何ですか? |
20 |
Greenstreetが出演した最初と最後の映画は何でしたか? |
The Maltese Falcon, Malaya |
Arasay Thondikeが上位20に入らなかったオリンピック大会はどれですか? |
2012 |
3つのタイトルをホストしたが、エピソードが1つしかなかった放送局はどれですか? |
Channel 4 |
使い方
これは、transformersでこのモデルを使用する方法です。
基本的な使用法
from transformers import TapexTokenizer, BartForConditionalGeneration
import pandas as pd
tokenizer = TapexTokenizer.from_pretrained("microsoft/tapex-large-finetuned-wtq")
model = BartForConditionalGeneration.from_pretrained("microsoft/tapex-large-finetuned-wtq")
data = {
"year": [1896, 1900, 1904, 2004, 2008, 2012],
"city": ["athens", "paris", "st. louis", "athens", "beijing", "london"]
}
table = pd.DataFrame.from_dict(data)
query = "In which year did beijing host the Olympic Games?"
encoding = tokenizer(table=table, query=query, return_tensors="pt")
outputs = model.generate(**encoding)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
評価方法
評価スクリプトはこちらにあります。
BibTeXエントリと引用情報
@inproceedings{
liu2022tapex,
title={{TAPEX}: Table Pre-training via Learning a Neural {SQL} Executor},
author={Qian Liu and Bei Chen and Jiaqi Guo and Morteza Ziyadi and Zeqi Lin and Weizhu Chen and Jian-Guang Lou},
booktitle={International Conference on Learning Representations},
year={2022},
url={https://openreview.net/forum?id=O50443AsCP}
}
📄 ライセンス
このプロジェクトはMITライセンスの下でライセンスされています。