🚀 TAPEX(基礎規模模型)
TAPEX是一種預訓練方法,通過學習神經SQL執行器,賦予現有模型“表格推理”能力,在表格問答和事實驗證等任務中表現出色。
🚀 快速開始
使用示例
以下是如何在transformers
庫中使用該模型的示例:
from transformers import TapexTokenizer, BartForConditionalGeneration
import pandas as pd
tokenizer = TapexTokenizer.from_pretrained("microsoft/tapex-base")
model = BartForConditionalGeneration.from_pretrained("microsoft/tapex-base")
data = {
"year": [1896, 1900, 1904, 2004, 2008, 2012],
"city": ["athens", "paris", "st. louis", "athens", "beijing", "london"]
}
table = pd.DataFrame.from_dict(data)
query = "select year where city = beijing"
encoding = tokenizer(table=table, query=query, return_tensors="pt")
outputs = model.generate(**encoding)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
微調方法
請在此處查找微調腳本。
✨ 主要特性
- 創新性預訓練方法:TAPEX(通過執行進行表格預訓練)是一種概念簡單且經驗證有效的預訓練方法,能讓現有模型具備“表格推理”技能。它通過在合成語料庫上學習神經SQL執行器來實現表格預訓練,該語料庫由自動合成的可執行SQL查詢獲得。
- 基於BART架構:TAPEX基於BART架構,這是一種Transformer編解碼器(seq2seq)模型,具有雙向(類似BERT)編碼器和自迴歸(類似GPT)解碼器。
- 多任務適用性:該模型主要用於在有監督的數據集上進行微調,目前可以針對表格問答任務和表格事實驗證任務進行微調。
📚 詳細文檔
模型描述
TAPEX(通過執行進行表格預訓練)是一種概念簡單且經驗證有效的預訓練方法,旨在賦予現有模型“表格推理”技能。TAPEX通過在合成語料庫上學習神經SQL執行器來實現表格預訓練,該語料庫是通過自動合成可執行SQL查詢獲得的。
TAPEX基於BART架構,這是一種Transformer編解碼器(seq2seq)模型,具有雙向(類似BERT)編碼器和自迴歸(類似GPT)解碼器。
預期用途
你可以使用原始模型來模擬神經SQL執行,即使用TAPEX在給定表格上執行SQL查詢。然而,該模型主要用於在有監督的數據集上進行微調。目前,TAPEX可以針對表格問答任務和表格事實驗證任務進行微調。請查看模型中心,查找針對你感興趣的任務進行微調的版本。
📄 許可證
本項目採用MIT許可證。
引用信息
@inproceedings{
liu2022tapex,
title={{TAPEX}: Table Pre-training via Learning a Neural {SQL} Executor},
author={Qian Liu and Bei Chen and Jiaqi Guo and Morteza Ziyadi and Zeqi Lin and Weizhu Chen and Jian-Guang Lou},
booktitle={International Conference on Learning Representations},
year={2022},
url={https://openreview.net/forum?id=O50443AsCP}
}
原論文信息
TAPEX由Qian Liu、Bei Chen、Jiaqi Guo、Morteza Ziyadi、Zeqi Lin、Weizhu Chen、Jian - Guang Lou在《TAPEX: Table Pre-training via Learning a Neural SQL Executor》中提出。原始代碼倉庫可在此處找到。