🚀 TAPEX (大規模モデル)
TAPEXは、Qian Liu、Bei Chen、Jiaqi Guo、Morteza Ziyadi、Zeqi Lin、Weizhu Chen、Jian - Guang Louによる「TAPEX: Table Pre-training via Learning a Neural SQL Executor」で提案されました。元のリポジトリはこちらで見ることができます。
🚀 クイックスタート
TAPEX (Table Pre - training via Execution) は、既存のモデルに表推論スキルを付与するための、概念的にシンプルで実証的に強力な事前学習アプローチです。TAPEXは、自動的に合成された実行可能なSQLクエリから得られる合成コーパスに対して、ニューラルSQLエグゼキュータを学習することで表の事前学習を実現します。
TAPEXはBARTアーキテクチャに基づいており、双方向 (BERTのような) エンコーダと自己回帰 (GPTのような) デコーダを持つトランスフォーマーエンコーダ - エンコーダ (seq2seq) モデルです。
✨ 主な機能
このモデルは、ニューラルSQL実行のシミュレーションに使用できます。つまり、与えられた表に対してSQLクエリを実行するためにTAPEXを使用できます。ただし、このモデルは主に教師付きデータセットでファインチューニングすることを想定しています。現在、TAPEXは表質問応答タスクや表事実検証タスクを解決するためにファインチューニングできます。関心のあるタスクでファインチューニングされたバージョンをモデルハブで探すことができます。
💻 使用例
基本的な使用法
from transformers import TapexTokenizer, BartForConditionalGeneration
import pandas as pd
tokenizer = TapexTokenizer.from_pretrained("microsoft/tapex-large-sql-execution")
model = BartForConditionalGeneration.from_pretrained("microsoft/tapex-large-sql-execution")
data = {
"year": [1896, 1900, 1904, 2004, 2008, 2012],
"city": ["athens", "paris", "st. louis", "athens", "beijing", "london"]
}
table = pd.DataFrame.from_dict(data)
query = "select year where city = beijing"
encoding = tokenizer(table=table, query=query, return_tensors="pt")
outputs = model.generate(**encoding)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
高度な使用法
このモデルは、主にファインチューニングを前提としています。ファインチューニングを行うことで、表質問応答タスクや表事実検証タスクなどの特定のタスクに適用できます。
📚 ドキュメント
ファインチューニングについて
⚠️ このモデルチェックポイントは、ニューラルSQL実行のシミュレーション (つまり、与えられた表に対してSQLクエリを実行するためにTAPEXを使用すること) にのみ使用でき、下流タスクでのファインチューニングには使用できません。ファインチューニングに使用できるモデルはこちらにあります。
この2種類の目的のための2つのモデルの分離は、BART largeにおける既知の問題によるものです。詳細については、このコメントを参照することをお勧めします。
BibTeXエントリと引用情報
@inproceedings{
liu2022tapex,
title={{TAPEX}: Table Pre-training via Learning a Neural {SQL} Executor},
author={Qian Liu and Bei Chen and Jiaqi Guo and Morteza Ziyadi and Zeqi Lin and Weizhu Chen and Jian-Guang Lou},
booktitle={International Conference on Learning Representations},
year={2022},
url={https://openreview.net/forum?id=O50443AsCP}
}
📄 ライセンス
このモデルはMITライセンスの下で提供されています。