Chat2DB - SQL - 7Bオープンソースモデル - 無料で自然言語をSQLに変換、多方言の長いテキストに対応

ホーム

Chat2db SQL 7B

Chat2DBによって開発

CodeLlamaをファインチューニングした70億パラメータモデルで、自然言語からSQLへの変換タスク専用に設計されており、複数のSQL方言と16kのコンテキスト長処理をサポート

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #自然言語からSQLへの変換 #多方言サポート #16kの長いコンテキスト

ダウンロード数 382

リリース時間 : 4/1/2024

モデル概要

オープンソースプロジェクトChat2DBの一部で、自然言語クエリを効率的に構造化SQL文に変換する機能を提供

モデル特徴

多方言サポート

MySQL、PostgreSQL、SQLiteなど複数の一般的なSQL方言をサポート

長いコンテキスト処理

16kのコンテキスト長処理能力を備えている

効率的な変換

自然言語からSQLへの変換タスクに最適化された設計

モデル能力

自然言語からSQLへの変換

複数SQL方言変換

データベースクエリ生成

使用事例

データベース管理

自然言語クエリ変換

ユーザーの自然言語クエリを構造化SQL文に変換

spiderデータセットで総合スコア77.3

データベースインタラクション簡素化

非技術者のデータベース使用ハードルを低減

🚀 Chat2DB-GLM

Chat2DB-GLMは、オープンソースプロジェクトChat2DBの一部で、自然言語クエリを構造化されたSQL文に変換する効率的な方法を提供することを目的としています。オープンソース化されたChat2DB-SQL-7Bモデルは、70億のパラメータを持ち、CodeLlamaをベースにファインチューニングされています。このモデルは、自然言語からSQLへの変換タスクに特化しており、様々なSQL方言をサポートし、最大16kのコンテキスト長を扱うことができます。

🚀 クイックスタート

Chat2DB-GLMは、自然言語をSQL文に変換することで、データベース操作を簡単に行えるようにします。以下の使用例を参考に、モデルを使ってみましょう。

✨ 主な機能

多方言サポート：MySQL、PostgreSQL、SQLiteなど、様々なSQL方言をサポートします。
高いパフォーマンス：spiderデータセットを用いた評価で、様々なSQL機能を高い精度で扱えることが示されています。
長いコンテキスト処理：最大16kのコンテキスト長を扱うことができます。

📦 インストール

このモデルは、transformersライブラリを通じてロードすることができます。以下のコードを参考に、モデルをロードしてみましょう。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
model_path = "Chat2DB/Chat2DB-SQL-7B" # これはあなたのローカルモデルパスに置き換えることができます
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True, torch_dtype=torch.float16, use_cache=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, return_full_text=False, max_new_tokens=100)

💻 使用例

基本的な使用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
model_path = "Chat2DB/Chat2DB-SQL-7B" # これはあなたのローカルモデルパスに置き換えることができます
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True, torch_dtype=torch.float16, use_cache=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, return_full_text=False, max_new_tokens=100)
prompt = "### Database Schema\n\n['CREATE TABLE \"stadium\" (\\n\"Stadium_ID\" int,\\n\"Location\" text,\\n\"Name\" text,\\n\"Capacity\" int,\\n\"Highest\" int,\\n\"Lowest\" int,\\n\"Average\" int,\\nPRIMARY KEY (\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer\" (\\n\"Singer_ID\" int,\\n\"Name\" text,\\n\"Country\" text,\\n\"Song_Name\" text,\\n\"Song_release_year\" text,\\n\"Age\" int,\\n\"Is_male\" bool,\\nPRIMARY KEY (\"Singer_ID\")\\n);', 'CREATE TABLE \"concert\" (\\n\"concert_ID\" int,\\n\"concert_Name\" text,\\n\"Theme\" text,\\n\"Stadium_ID\" text,\\n\"Year\" text,\\nPRIMARY KEY (\"concert_ID\"),\\nFOREIGN KEY (\"Stadium_ID\") REFERENCES \"stadium\"(\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer_in_concert\" (\\n\"concert_ID\" int,\\n\"Singer_ID\" text,\\nPRIMARY KEY (\"concert_ID\",\"Singer_ID\"),\\nFOREIGN KEY (\"concert_ID\") REFERENCES \"concert\"(\"concert_ID\"),\\nFOREIGN KEY (\"Singer_ID\") REFERENCES \"singer\"(\"Singer_ID\")\\n);']\n\n\n### Task \n\nBased on the provided database schema information, How many singers do we have?[SQL]\n"
response = pipe(prompt)[0]["generated_text"]
print(response)

📚 ドキュメント

方言サポート

Chat2DB-SQL-7Bモデルは、MySQL、PostgreSQL、SQLiteなど、幅広いSQL方言をサポートしています。このクロス方言の機能により、モデルの幅広い適用性と柔軟性が保証されます。

モデルのパフォーマンス

Chat2DB-SQL-7Bモデルは、複数の方言とSQLの主要部分にわたって優れたパフォーマンスを示しています。以下は、spiderデータセットを用いた評価に基づく、一般的なSQLの各キー部分でのモデルのパフォーマンスの概要で、様々なSQL機能（日付関数、文字列関数など）を扱うモデルの能力を示しています。

方言	select	where	group	order	関数	合計
一般的なSQL	91.5	83.7	80.5	98.2	96.2	77.3

モデルの制限事項と使用上の注意

Chat2DB-SQL-7Bは、主にMySQL、PostgreSQL、および一般的なSQLの方言に対してファインチューニングされました。モデルは他のSQL方言に対して基本的な変換機能を提供することができますが、特定の方言の特殊な関数（日付関数、文字列関数など）を扱う際に不正確さが生じる可能性があります。パフォーマンスはデータセットの変更によって異なる場合があります。

このモデルは主に学術研究および学習目的で使用することを意図しています。モデルの出力の正確性を確保するよう努めていますが、本番環境でのパフォーマンスは保証されません。このモデルを使用して生じる可能性のある損失は、このプロジェクトまたはその貢献者の責任ではありません。ユーザーは使用前に特定のユースケースにおけるその適用性を慎重に評価することをお勧めします。