🚀 ChartGPT モデルカード
このモデルは自然言語からチャートを生成するために使用されます。詳細については論文を参照してください。
🚀 クイックスタート
GPUでのモデルの実行
「What kinds of movies are the most popular?」という発話を含む映画データセットの例を示します。モデルはステップ1(列の選択)に対する回答を返す必要があります。以下のコードを使用して、モデルを正常に実行できるかテストできます。
基本的な使用法
from transformers import (
AutoTokenizer,
AutoModelForSeq2SeqLM,
)
tokenizer = AutoTokenizer.from_pretrained("yuan-tian/chartgpt")
model = AutoModelForSeq2SeqLM.from_pretrained("yuan-tian/chartgpt", device_map="auto")
input_text = "movies <head> Title,Worldwide_Gross,Production_Budget,Release_Year,Content_Rating,Running_Time,Major_Genre,Creative_Type,Rotten_Tomatoes_Rating,IMDB_Rating <type> nominal,quantitative,quantitative,temporal,nominal,quantitative,nominal,nominal,quantitative,quantitative <data> From Dusk Till Dawn,25728961,20000000,1996,R,107,Horror,Fantasy,63,7.1 <line> Broken Arrow,148345997,65000000,1996,R,108,Action,Contemporary Fiction,55,5.8 <line> <utterance> What kinds of movies are the most popular? <ans> <sep> Step 1. Select the columns:"
inputs = tokenizer(input_text, return_tensors="pt", padding=True).to("cuda")
outputs = model.generate(**inputs)
print(tokenizer.decode(outputs[0], skip_special_tokens = True))
✨ 主な機能
このモデルは自然言語からチャートを生成するために使用されます。
📦 インストール
このセクションでは、モデルを使用するための基本的なインストール手順を説明します。
📚 ドキュメント
モデルの詳細
モデルの説明
このモデルは自然言語からチャートを生成するために使用されます。詳細については論文を参照してください。
モデルの入力形式
クリックして展開
ステップ x
でのモデル入力。具体的には、<...>
が区切りトークンとして機能します。
{table name}
<head> {column names}
<type> {column types}
<data> {data row 1} <line> {data row 2} <line>
<utterance> {NL utterance}
<ans>
<sep> {Step 1 prompt} {Answer 2}
...
<sep> {Step x-1 prompt} {Answer x-1}
<sep> {Step x prompt}
そして、モデルはステップ x
に対応する回答を出力する必要があります。
ステップ1 - 6のプロンプトは以下の通りです。
Step 1. Select columns:
Step 2. Add filter:
Step 3. Add aggregations:
Step 4. Select chart type:
Step 5. Choose encoding:
Step 6. Add sort:
トレーニングの詳細
トレーニングデータ
このモデルは FLAN-T5-XL を chartgpt-dataset でファインチューニングしたものです。
トレーニング手順
将来的に前処理とトレーニング手順を更新する予定です。
🔧 技術詳細
モデル入力形式やトレーニングデータ、手順などについて、上記で詳細な説明を行っています。
📄 ライセンス
このモデルはApache 2.0ライセンスの下で提供されています。
引用
BibTeX:
@article{tian2024chartgpt,
title={ChartGPT: Leveraging LLMs to Generate Charts from Abstract Natural Language},
author={Tian, Yuan and Cui, Weiwei and Deng, Dazhen and Yi, Xinjing and Yang, Yurun and Zhang, Haidong and Wu, Yingcai},
journal={IEEE Transactions on Visualization and Computer Graphics},
year={2024},
pages={1-15},
doi={10.1109/TVCG.2024.3368621}
}