Chat2DB-SQL-7B开源模型 - 免费将自然语言转SQL，支持多方言长文本

首页

Chat2db SQL 7B

由 Chat2DB 开发

基于CodeLlama微调的70亿参数模型，专为自然语言转SQL任务设计，支持多种SQL方言和16k上下文长度处理

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #自然语言转SQL #多方言支持 #16k长上下文

下载量 382

发布时间 : 4/1/2024

模型简介

开源项目Chat2DB的组成部分，提供将自然语言查询高效转换为结构化SQL语句的能力

模型特点

多方言支持

支持MySQL、PostgreSQL、SQLite等多种常见SQL方言

长上下文处理

具备16k上下文长度的处理能力

高效转换

专为自然语言转SQL任务优化设计

模型能力

自然语言转SQL

多SQL方言转换

数据库查询生成

使用案例

数据库管理

自然语言查询转换

将用户自然语言查询转换为结构化SQL语句

在spider数据集上综合得分77.3

数据库交互简化

降低非技术人员使用数据库的门槛

🚀 Chat2DB-GLM

Chat2DB-GLM 是开源项目 Chat2DB 的一部分，旨在提供一种高效的方式，将自然语言查询转换为结构化 SQL 语句。开源的 Chat2DB-SQL-7B 模型拥有 70 亿参数，基于 CodeLlama 进行了微调。该模型专为自然语言到 SQL 的转换任务而设计，支持多种 SQL 方言，并且能够处理长达 16k 的上下文长度。

🚀 快速开始

模型推理

你可以通过 transformers 库加载模型，并使用以下示例代码片段来使用 Chat2DB-SQL-7B 模型。模型的性能可能会因输入提示的不同而有所差异，因此请尽量遵循以下示例中提供的提示格式。代码块中的 model_path 可以替换为你本地的模型路径。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
model_path = "Chat2DB/Chat2DB-SQL-7B" # This can be replaced with your local model path
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", trust_remote_code=True, torch_dtype=torch.float16, use_cache=True)
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, return_full_text=False, max_new_tokens=100)
prompt = "### Database Schema\n\n['CREATE TABLE \"stadium\" (\\n\"Stadium_ID\" int,\\n\"Location\" text,\\n\"Name\" text,\\n\"Capacity\" int,\\n\"Highest\" int,\\n\"Lowest\" int,\\n\"Average\" int,\\nPRIMARY KEY (\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer\" (\\n\"Singer_ID\" int,\\n\"Name\" text,\\n\"Country\" text,\\n\"Song_Name\" text,\\n\"Song_release_year\" text,\\n\"Age\" int,\\n\"Is_male\" bool,\\nPRIMARY KEY (\"Singer_ID\")\\n);', 'CREATE TABLE \"concert\" (\\n\"concert_ID\" int,\\n\"concert_Name\" text,\\n\"Theme\" text,\\n\"Stadium_ID\" text,\\n\"Year\" text,\\nPRIMARY KEY (\"concert_ID\"),\\nFOREIGN KEY (\"Stadium_ID\") REFERENCES \"stadium\"(\"Stadium_ID\")\\n);', 'CREATE TABLE \"singer_in_concert\" (\\n\"concert_ID\" int,\\n\"Singer_ID\" text,\\nPRIMARY KEY (\"concert_ID\",\"Singer_ID\"),\\nFOREIGN KEY (\"concert_ID\") REFERENCES \"concert\"(\"concert_ID\"),\\nFOREIGN KEY (\"Singer_ID\") REFERENCES \"singer\"(\"Singer_ID\")\\n);']\n\n\n### Task \n\nBased on the provided database schema information, How many singers do we have?[SQL]\n"
response = pipe(prompt)[0]["generated_text"]
print(response)

✨ 主要特性

多方言支持：Chat2DB-SQL-7B 模型支持广泛的 SQL 方言，包括但不限于 MySQL、PostgreSQL、SQLite 等常见 SQL 方言。这种跨方言能力确保了模型具有广泛的适用性和灵活性。
高性能表现：该模型在多种方言和 SQL 的关键部分都表现出了出色的性能。在处理各种 SQL 函数（如日期函数、字符串函数等）方面展现出强大的能力。