Prem-1B-SQLオープンソーステキスト→SQLモデル - ローカルデプロイをサポート、低スペックデバイスでも動作可能

ホーム

Prem 1B SQL

premai-ioによって開発

Prem-1B-SQLはPrem AIが開発した10億パラメータのテキストからSQLへの変換モデルで、ローカル展開向けに設計されており、低スペックのGPUやCPUデバイスでの実行をサポートします。

大規模言語モデル

Safetensors

英語オープンソースライセンス:Apache-2.0 #テキストからSQLへ #ローカル展開 #小規模パラメータで効率的

ダウンロード数 521

リリース時間 : 8/31/2024

モデル概要

これは完全にローカル化されたテキストからSQLへの変換モデルで、データセキュリティに重点を置き、自然言語を実行可能なSQLクエリ文に変換できます。

モデル特徴

ローカルファースト設計

完全なローカル実行をサポートし、データベースを第三者サービスに公開することを避け、データセキュリティを確保します

軽量な展開

10億パラメータ規模で、低スペックGPUデバイスで実行可能、量子化後はCPUでの実行もサポート

実行誘導デコード

生成されたSQLを実行し、エラー情報を利用して反復修正を行い、精度を向上させます

複数データセットサポート

BirdBench、Spiderなどの主要なテキストからSQLへのベンチマークデータセットをサポート

モデル能力

自然言語からSQLへ

データベースクエリ生成

SQLエラー自動修正

データ分析支援

使用事例

データ分析

ビジネスインテリジェンスクエリ

自然言語からSQLクエリを生成し、迅速に業務データの洞察を得ます

非技術者のデータクエリプロセスを簡素化

データベース管理

データベースのメンテナンスと管理のためのSQL文を自動生成

データベース管理者の作業効率を向上

教育

SQL学習支援

学生が自然言語とSQL文の対応関係を理解するのを支援

SQL学習のハードルを低減

🚀 Prem-1B-SQL (HuggingFace)

Prem-1B-SQLは、Prem AIによって開発された完全にローカルなText-to-SQLモデルの最初のシリーズの1つです。10億個のパラメータを持つモデルであり、低グレードのGPUデバイス（量子化するとCPUデバイスでも）に簡単に収まります。AIによるデータ分析は、まずローカルで行うべきだと考えています。なぜなら、データベースをサードパーティのクローズドソースモデルに公開すると、データセキュリティ上の問題につながる可能性があるからです。このモデルのいくつかの公開ベンチマーク結果を近日中に公開する予定です。また、より良い結果を得るためにこのモデルを改善していきます。

ブログ記事はこちらで読めます。
PremSQLライブラリ | GitHub
開発元: Prem AI
ライセンス: [MIT]

🚀 クイックスタート

モデルの評価結果

私たちは、2つの人気のあるベンチマークデータセット、BirdBenchとSpiderでモデルを評価しました。BirdBenchは、公開検証データセット（1534のデータポイント）と非公開テストデータセットで構成されています。Spiderは、公開検証データセットのみを提供します。以下はその結果です。

データセット	実行精度
BirdBench (検証)	46%
BirdBench (非公開テスト)	51.54%
Spider	85%

BirdBenchデータセットは、さまざまな難易度レベルに分けられています。以下は、異なる難易度レベルでの非公開結果の詳細です。

難易度	件数	実行精度	Soft F1
簡単	949	60.70	61.48
中程度	555	47.39	49.06
難しい	285	29.12	31.83
合計	1789	51.54	52.90

以下は、人気のあるクローズドソースモデルとオープンソースモデルのより詳細な比較です。

モデル	# パラメータ (10億単位)	BirdBenchテストスコア
AskData + GPT-4o (現状の勝者)	NA	72.39
DeepSeek coder 236B	236	56.68
GPT-4 (2023)	NA	54.89
PremSQL 1B (当社のモデル)	1	51.4
Qwen 2.5 7B Instruct	7	51.1
Claude 2 Base (2023)	NA	49.02

📦 インストール

PremSQLをインストールするには、新しい環境を作成して以下のコマンドを入力します。

pip install -U premsql

💻 使用例

基本的な使用法

PremSQL BaseLine Agentを使用してPrem-1B-SQLを実行する方法は次の通りです。

from premsql.agents import BaseLineAgent
from premsql.generators import Text2SQLGeneratorOllama
from premsql.agents.tools import SimpleMatplotlibTool
from premsql.executors import SQLiteExecutor

text2_sqlmodel = Text2SQLGeneratorHF(
    model_or_name_or_path="premai-io/prem-1B-SQL",
    experiment_name="test_generators",
    device="cuda:0",
    type="test"
)

analyser_and_plotter = Text2SQLGeneratorHF(
    model_or_name_or_path="meta-llama/Llama-3.2-1B-Instruct",
    experiment_name="test_generators",
    device="cuda:0",
    type="test"
)

agent = BaseLineAgent(
    session_name="testing_hf",
    db_connection_uri="sqlite:////path/to/your/database.sqlite",
    specialized_model1=model,
    specialized_model2=model,
    plot_tool=SimpleMatplotlibTool(),
    executor=SQLiteExecutor()
)

response = agent(
    "/query what all tables are present inside the database"
)
response.show_dataframe()

高度な使用法

PremSQL Generatorsを使用してモデルを実行することもできます。これは、あるデータセットに対して大量の生成を行いたい場合に便利です。以下はその例です。

from premsql.generators import Text2SQLGeneratorHF
from premsql.datasets import Text2SQLDataset

# Define a dataset
dataset = bird_dataset = Text2SQLDataset(
    dataset_name='bird', split="validation", force_download=False,
    dataset_folder="/path/to/dataset"
).setup_dataset(num_rows=10, num_fewshot=3)

# Define a generator
generator = Text2SQLGeneratorHF(
    model_or_name_or_path="premai-io/prem-1B-SQL",
    experiment_name="test_generators",
    device="cuda:0",
    type="test"
)

# Generate on the full dataset
responses = generator.generate_and_save_results(
    dataset=bird_dataset,
    temperature=0.1,
    max_new_tokens=256
)

print(responses)

実行ガイド付きデコーディングの使用

この戦略では、生成されたSQLをDBに対して実行し、失敗した場合はエラーメッセージを使用して修正し、有効な結果が得られるか、リトライが上限に達するまで繰り返します。

image/png

from premsql.executors import SQLiteExecutor

executor = SQLiteExecutor()
response = generator.generate_and_save_results(
    dataset=bird_dataset,
    temperature=0.1,
    max_new_tokens=256,
    force=True,
    executor=executor,
    max_retries=5 # this is optional (default is already set to 5)
)