Chat2DB-SQL-7B開源模型 - 免費將自然語言轉SQL，支持多方言長文本

首頁

Chat2db SQL 7B

由Chat2DB開發

基於CodeLlama微調的70億參數模型，專為自然語言轉SQL任務設計，支持多種SQL方言和16k上下文長度處理

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #自然語言轉SQL #多方言支持 #16k長上下文

下載量 382

發布時間 : 4/1/2024

模型概述

開源項目Chat2DB的組成部分，提供將自然語言查詢高效轉換為結構化SQL語句的能力

模型特點

多方言支持

支持MySQL、PostgreSQL、SQLite等多種常見SQL方言

長上下文處理

具備16k上下文長度的處理能力

高效轉換

專為自然語言轉SQL任務優化設計

模型能力

自然語言轉SQL

多SQL方言轉換

數據庫查詢生成

使用案例

數據庫管理

自然語言查詢轉換

將用戶自然語言查詢轉換為結構化SQL語句

在spider數據集上綜合得分77.3

數據庫交互簡化

降低非技術人員使用數據庫的門檻

🚀 Chat2DB-GLM

Chat2DB-GLM 是開源項目 Chat2DB 的一部分，旨在提供一種高效的方式，將自然語言查詢轉換為結構化 SQL 語句。開源的 Chat2DB-SQL-7B 模型擁有 70 億參數，基於 CodeLlama 進行了微調。該模型專為自然語言到 SQL 的轉換任務而設計，支持多種 SQL 方言，並且能夠處理長達 16k 的上下文長度。

🚀 快速開始

模型推理

你可以通過 transformers 庫加載模型，並使用以下示例代碼片段來使用 Chat2DB-SQL-7B 模型。模型的性能可能會因輸入提示的不同而有所差異，因此請儘量遵循以下示例中提供的提示格式。代碼塊中的 model_path 可以替換為你本地的模型路徑。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
model_path = "Chat2DB/Chat2DB-SQL-7B" # This can be replaced with your local model path
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True, torch_dtype=torch.float16, use_cache=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, return_full_text=False, max_new_tokens=100)
prompt = "### Database Schema\n\n['CREATE TABLE \"stadium\" (\\n\"Stadium_ID\" int,\\n\"Location\" text,\\n\"Name\" text,\\n\"Capacity\" int,\\n\"Highest\" int,\\n\"Lowest\" int,\\n\"Average\" int,\\nPRIMARY KEY (\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer\" (\\n\"Singer_ID\" int,\\n\"Name\" text,\\n\"Country\" text,\\n\"Song_Name\" text,\\n\"Song_release_year\" text,\\n\"Age\" int,\\n\"Is_male\" bool,\\nPRIMARY KEY (\"Singer_ID\")\\n);', 'CREATE TABLE \"concert\" (\\n\"concert_ID\" int,\\n\"concert_Name\" text,\\n\"Theme\" text,\\n\"Stadium_ID\" text,\\n\"Year\" text,\\nPRIMARY KEY (\"concert_ID\"),\\nFOREIGN KEY (\"Stadium_ID\") REFERENCES \"stadium\"(\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer_in_concert\" (\\n\"concert_ID\" int,\\n\"Singer_ID\" text,\\nPRIMARY KEY (\"concert_ID\",\"Singer_ID\"),\\nFOREIGN KEY (\"concert_ID\") REFERENCES \"concert\"(\"concert_ID\"),\\nFOREIGN KEY (\"Singer_ID\") REFERENCES \"singer\"(\"Singer_ID\")\\n);']\n\n\n### Task \n\nBased on the provided database schema information, How many singers do we have?[SQL]\n"
response = pipe(prompt)[0]["generated_text"]
print(response)

✨ 主要特性

多方言支持：Chat2DB-SQL-7B 模型支持廣泛的 SQL 方言，包括但不限於 MySQL、PostgreSQL、SQLite 等常見 SQL 方言。這種跨方言能力確保了模型具有廣泛的適用性和靈活性。
高性能表現：該模型在多種方言和 SQL 的關鍵部分都表現出了出色的性能。在處理各種 SQL 函數（如日期函數、字符串函數等）方面展現出強大的能力。