シーヤンSQL - QwenCoder - 7B - 2504オープンソースSQL生成モデル

ホーム

Xiyansql QwenCoder 7B 2504

XGenerationLabによって開発

QwenCoderをファインチューニングしたSQL生成モデルで、複数のダイアレクトに対応し、優れた性能を発揮

テキスト生成

Safetensors

複数言語対応オープンソースライセンス:Apache-2.0 #SQL自動生成 #マルチダイアレクト対応 #GRPOファインチューニング

ダウンロード数 266

リリース時間 : 4/28/2025

モデル概要

XiYanSQL-QwenCoder-7B-2502はSQL生成に特化したモデルで、ファインチューニングとGRPOトレーニング戦略により最適化され、効率的かつ正確にSQLクエリを生成でき、複数のデータベースダイアレクトとクロスドメインアプリケーションをサポートします。

モデル特徴

マルチダイアレクト対応

PostgreSQL、MySQLなど複数のデータベースダイアレクトのSQL生成をサポート

GRPOトレーニング戦略

GRPO後トレーニング戦略を採用し、思考プロセスなしで効率的かつ正確なSQL生成を実現

クロスドメイン性能

異なるダイアレクトやクロスドメインデータセットで優れた汎化能力を発揮

モデル能力

SQL生成

マルチ言語サポート

クロスドメインアプリケーション

使用事例

データベースクエリ

複雑クエリ生成

自然言語の記述に基づいて複雑なSQLクエリ文を生成

DWテストセットで優れた性能を発揮

クロスデータベースサポート

異なるデータベースシステムに適応したSQL文を生成

PostgreSQLやMySQLなど複数のダイアレクトをサポート

🚀 析言SQL-QwenCoder-2504

このモデルは、最新のSQL生成モデルであり、前バージョンをベースに最適化され、性能が向上しています。微調整とGRPOトレーニングを組み合わせたアプローチを採用し、複数の方言に対応し、即座に使用できます。

モデル情報

属性	详情
フレームワーク	Pytorch
タスク	テキスト生成
ベースモデル	XGenerationLab/XiYanSQL-QwenCoder-7B-2502
ベースモデル関係	ファインチューニング
言語	英語、中国語
ライセンス	apache-2.0
パイプラインタグ	テキスト生成

重要リンク

📖Github | 🤖ModelScope | 🌐XiYan-SQL | 🌕析言GBI | 💻Modelscope Space

🚀 クイックスタート

要件

transformers >= 4.37.0
vllm >= 0.7.2

プロンプトテンプレート

nl2sqlite_template_cn = """你是一名{dialect}专家，现在需要阅读并理解下面的【数据库schema】描述，以及可能用到的【参考信息】，并运用{dialect}知识生成sql语句回答【用户问题】。
【用户问题】
{question}

【数据库schema】
{db_schema}

【参考信息】
{evidence}

【用户问题】
{question}

```sql"""

Transformersを使用した推論

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "XGenerationLab/XiYanSQL-QwenCoder-32B-2504"
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)

tokenizer = AutoTokenizer.from_pretrained(model_name)

## dialects -> ['SQLite', 'PostgreSQL', 'MySQL']
prompt = nl2sqlite_template_cn.format(dialect="", db_schema="", question="", evidence="")
message = [{'role': 'user', 'content': prompt}]

text = tokenizer.apply_chat_template(
    message,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    pad_token_id=tokenizer.pad_token_id,
    eos_token_id=tokenizer.eos_token_id,
    max_new_tokens=1024,
    temperature=0.1,
    top_p=0.8,
    do_sample=True,
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

vLLMを使用した推論

from vllm import LLM, SamplingParams
from transformers import AutoTokenizer
model_path = "XGenerationLab/XiYanSQL-QwenCoder-32B-2504"
llm = LLM(model=model_path, tensor_parallel_size=8)
tokenizer = AutoTokenizer.from_pretrained(model_path)
sampling_params = SamplingParams(
    n=1,
    temperature=0.1,
    max_tokens=1024
)

## dialects -> ['SQLite', 'PostgreSQL', 'MySQL']
prompt = nl2sqlite_template_cn.format(dialect="", db_schema="", question="", evidence="")
message = [{'role': 'user', 'content': prompt}]
text = tokenizer.apply_chat_template(
    message,
    tokenize=False,
    add_generation_prompt=True
)
outputs = llm.generate([text], sampling_params=sampling_params)
response = outputs[0].outputs[0].text

✨ 主な機能

微調整とGRPOトレーニングの組み合わせ：GRPOの事後トレーニング戦略を活用し、SQL生成の効率と精度を両立させます。
複数の方言に対応：SQLite、PostgreSQL、MySQLなどの主流の方言をサポートしています。
汎化能力の向上：異なる方言やドメイン外のデータセットでも優れた性能を発揮します。

📦 モデルダウンロード

モデル	最新版ダウンロード
XiYanSQL-QwenCoder-3B	🤗HuggingFace 🤖Modelscope
XiYanSQL-QwenCoder-7B	🤗HuggingFace 🤖Modelscope
XiYanSQL-QwenCoder-14B	🤗HuggingFace 🤖Modelscope
XiYanSQL-QwenCoder-32B	🤗HuggingFace 🤖Modelscope

📚 ドキュメント

性能評価

このモデルは、多方言SQLベースモデルとして、強力なSQL生成能力を示しています。以下はリリース時の評価結果です。

モデル名	サイズ	BIRD Dev@M-Schema	BIRD Dev@DDL	Spider Test@M-Schema	Spider Test@DDL	DW PostgreSQL@M-Schema	DW MySQL@M-Schema
GPT-4o-0806	UNK	58.47%	54.82%	82.89%	78.45%	46.79%	57.77%
GPT-4.1-0414	UNK	59.39%	54.11%	84.45%	79.86%	54.29%	63.18%
Claude3.5-sonnet-1022	UNK	53.32%	50.46%	76.27%	73.04%	55.22%	52.84%
Claude3.7-sonnet	UNK	54.82%	49.22%	78.04%	74.66%	53.23%	54.61%
Gemini-1.5-Pro	UNK	61.34%	57.89%	85.11%	84.00%	52.78%	62.78%
DeepSeek-V2.5-1210	236B	55.74%	55.61%	82.08%	80.57%	45.74%	52.18%
DeepSeek-V3	685B	59.58%	56.71%	81.52%	79.91%	52.56%	55.95%
DeepSeek-R1	685B	58.15%	55.61%	80.72%	78.85%	60.56%	62.00%
DeepSeek-R1-Distill-Qwen-32B	32B	50.65%	48.31%	78.65%	77.33%	37.22%	44.72%
Deepseek-Coder-33B-Instruct	33B	47.52%	44.72%	72.39%	62.0%	31.48%	36.17%
OmniSQL-32B	32B	60.37%	55.87%	85.16%	83.19%	38.19%	42.34%
XiYanSQL-QwenCoder-3B-2502	3B	53.52%	52.54%	83.34%	79.10%	34.75%	35.62%
XiYanSQL-QwenCoder-3B-2504	3B	55.08%	52.09%	84.10%	80.57%	36.65%	37.63%
XiYanSQL-QwenCoder-7B-2502	7B	59.65%	56.32%	84.15%	80.01%	39.38%	42.10%
XiYanSQL-QwenCoder-7B-2504	7B	62.13%	57.43%	85.97%	82.48%	42.08%	44.67%
XiYanSQL-QwenCoder-14B-2502	14B	63.23%	60.10%	85.31%	82.84%	38.51%	41.62%
XiYanSQL-QwenCoder-14B-2504	14B	65.32%	60.17%	86.82%	83.75%	40.52%	44.60%
XiYanSQL-QwenCoder-32B-2412	32B	67.07%	63.04%	88.39%	85.46%	45.07%	52.84%
XiYanSQL-QwenCoder-32B-2504	32B	67.14%	62.26%	89.20%	86.17%	53.52%	57.74%