Starchat-alpha开源编程助手模型 - 160亿参数助力教育研究领域编程学习

首页

Starchat Alpha

由 HuggingFaceH4 开发

基于StarCoder微调的编程助手语言模型，160亿参数规模，支持英语，适用于教育研究领域

大型语言模型

Transformers

支持多种语言开源协议:Openrail #编程助手 #代码生成 #教育研究

下载量 1,647

发布时间 : 5/9/2023

模型简介

StarChat Alpha是基于StarCoder微调的首个编程助手模型系列，专注于代码生成与编程辅助任务

模型特点

代码微调优化

基于StarCoder基础模型在编程相关数据集上微调，强化代码理解与生成能力

多轮对话支持

通过特殊标记支持对话式交互，适合编程问答场景

教育研究导向

专门设计用于探索开源语言模型在编程领域的应用边界

模型能力

代码生成

编程问题解答

代码片段解释

算法实现建议

使用案例

编程教育

代码示例生成

根据自然语言描述生成可运行的代码示例

快速展示编程概念的实际应用

编程问题解答

解释编程语言特性或解决特定编码问题

辅助学习者理解复杂概念

研究开发

原型代码生成

快速生成算法或功能模块的初始实现

加速研究项目的早期开发阶段

🚀 StarChat Alpha模型卡片

StarChat是一系列基于StarCoder微调的语言模型，旨在成为实用的编码助手。StarChat Alpha是该系列的首个模型，作为Alpha版本，仅用于教育或研究目的。该模型尚未使用如基于人类反馈的强化学习（RLHF）等技术与人类偏好对齐，因此可能会生成有问题的内容（尤其是在被明确要求时）。

🚀 快速开始

使用以下代码开始使用该模型。

你可以使用🤗 Transformers库中的pipeline()函数来运行该模型：

import torch
from transformers import pipeline

pipe = pipeline("text-generation", model="HuggingFaceH4/starchat-alpha", torch_dtype=torch.bfloat16, device_map="auto")

prompt_template = "<|system|>\n<|end|>\n<|user|>\n{query}<|end|>\n<|assistant|>"
prompt = prompt_template.format(query="How do I sort a list in Python?")
# We use a special <|end|> token with ID 49155 to denote ends of a turn
outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, eos_token_id=49155)
# You can sort a list in Python by using the sort() method. Here's an example:\n\n```\nnumbers = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]\nnumbers.sort()\nprint(numbers)\n```\n\nThis will sort the list in place and print the sorted list.

✨ 主要特性

模型类型：基于GPT架构的160亿参数模型，在oasst1和databricks-dolly-15k数据集的混合数据上进行了微调。
语言：英语
许可证：BigCode Open RAIL - M v1
微调基础模型：bigcode/starcoderbase

📚 详细文档

模型来源

仓库：https://github.com/bigcode-project/starcoder
演示：https://huggingface.co/spaces/HuggingFaceH4/starchat-playground

使用场景

StarChat Alpha旨在用于教育和/或研究目的，可用于探索开源语言模型的编程能力。

偏差、风险和局限性

StarChat Alpha尚未使用如RLHF等技术与人类偏好对齐，也没有像ChatGPT那样在运行时对回复进行过滤，因此该模型可能会产生有问题的输出（尤其是在被明确要求时）。

主要基于代码数据训练的模型也会存在与GitHub社区人口统计特征相关的更明显的人口统计学偏差，更多信息请参阅源自The Stack的StarCoder数据集。

由于基础模型是在大量代码语料库上进行预训练的，它可能会生成语法正确但语义错误的代码片段。例如，它可能会生成无法编译或产生错误结果的代码，也可能会生成存在安全漏洞的代码。此外，我们还观察到该模型有生成虚假URL的倾向，点击前应仔细检查。

StarChat Alpha是基于基础模型StarCoder Base进行微调的，请参考其模型卡片的局限性部分获取相关信息。特别是，该模型在一些性别偏差类别、毒性倾向以及建议存在已知安全漏洞的代码补全风险方面进行了评估，这些评估结果在其[技术报告](https://drive.google.com/file/d/1cN - b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view)中有所报告。

📄 许可证

本模型使用BigCode Open RAIL - M v1许可证。

📖 引用

BibTeX：

@article{Tunstall2023starchat-alpha,
  author = {Tunstall, Lewis and Lambert, Nathan and Rajani, Nazneen and Beeching, Edward and Le Scao, Teven and von Werra, Leandro and Han, Sheon and Schmid, Philipp and Rush, Alexander},
  title = {Creating a Coding Assistant with StarCoder},
  journal = {Hugging Face Blog},
  year = {2023},
  note = {https://huggingface.co/blog/starchat},
}