slim-sql-1b-v0開源模型 - 免費根據自然語言生成簡單數據檢索SQL查詢

首頁

Slim Sql 1b V0

由llmware開發

SLIM系列首個模型，專為根據自然語言提示生成簡單表結構的數據檢索SQL查詢而設計

大型語言模型

Transformers

開源協議:Apache-2.0 #SQL生成 #自然語言轉SQL #輕量級模型

下載量 67

發布時間 : 1/1/2024

模型概述

基於TinyLlama微調的專用語言指令模型，主要用於生成簡單SQL查詢

模型特點

高效SQL生成

專門針對簡單表結構的數據檢索SQL查詢優化

小規模高效模型

基於1.1B參數的TinyLlama模型，在保持性能的同時減少資源消耗

結構化提示處理

採用特殊的人類/機器人標籤包裝器進行微調，優化提示響應

模型能力

自然語言到SQL轉換

簡單數據檢索查詢生成

聚合函數處理

使用案例

數據庫查詢

簡單數據檢索

根據自然語言問題生成SQL查詢語句

在100個測試樣本中達到86%準確率

聚合查詢生成

生成包含COUNT等聚合函數的SQL查詢

🚀 slim-sql-1b-v0模型介紹

slim-sql-1b-v0是SLIM（專用語言指令模型）系列的首個模型，能夠根據自然語言提示，為簡單表結構的數據檢索生成準確的SQL查詢。

🚀 快速開始

使用slim模型的最快方法是在transformers庫中直接導入：

from transformers import AutoTokenizer, AutoModelForCausalLM  
tokenizer = AutoTokenizer.from_pretrained("slim-sql-1b-v0")  
model = AutoModelForCausalLM.from_pretrained("slim-sql-1b-v0")

請參考文件倉庫中的generation_test.py文件，其中包含100個樣本和測試模型的腳本。

sql-slim模型使用簡單的“和包裝器”進行微調，因此為了獲得最佳效果，請將推理條目包裝為：

full_prompt = "<human>: " + my_prompt + "\n" + "<bot>:"

提示由兩部分組成：

提供表名、變量和變量類型的表創建提示。
基於文本段落的具體問題或指令。

測試樣本示例：

{"context": "CREATE TABLE table_name_34 (season VARCHAR, lost VARCHAR, points VARCHAR)", "question": "Which season did the Minnesota Kicks lose 13 games and score 156 points?", "answer": "SELECT COUNT(season) FROM table_name_34 WHERE lost = 13 AND points = 156"}

此倉庫中提供了一部分測試樣本（"sql_test_100_simple_s"）。

如果使用HuggingFace生成腳本：

# prepare prompt packaging used in fine-tuning process
new_prompt = "<human>: " + entries["context"] + "\n" + entries["query"] + "\n" + "<bot>:"

inputs = tokenizer(new_prompt, return_tensors="pt")  
start_of_output = len(inputs.input_ids[0])

#   temperature: set at 0.3 for consistency of output
#   max_new_tokens:  set at 100 - may prematurely stop a few of the summaries

outputs = model.generate(
        inputs.input_ids.to(device),
        eos_token_id=tokenizer.eos_token_id,
        pad_token_id=tokenizer.eos_token_id,
        do_sample=True,
        temperature=0.3,
        max_new_tokens=100,
        )

output_only = tokenizer.decode(outputs[0][start_of_output:],skip_special_tokens=True)

✨ 主要特性

slim-sql-1b-v0專為根據自然語言提示，為簡單表結構的數據檢索生成準確的SQL查詢而設計。為獲得最佳效果，提示應構造成一個問題，以檢索信息並對一個或多個變量執行聚合函數。

📦 安裝指南

通過transformers庫直接導入模型：

from transformers import AutoTokenizer, AutoModelForCausalLM  
tokenizer = AutoTokenizer.from_pretrained("slim-sql-1b-v0")  
model = AutoModelForCausalLM.from_pretrained("slim-sql-1b-v0")