Starchat-alpha開源編程助手模型 - 160億參數助力教育研究領域編程學習

首頁

Starchat Alpha

由HuggingFaceH4開發

基於StarCoder微調的編程助手語言模型，160億參數規模，支持英語，適用於教育研究領域

大型語言模型

Transformers

支持多種語言開源協議:Openrail #編程助手 #代碼生成 #教育研究

下載量 1,647

發布時間 : 5/9/2023

模型概述

StarChat Alpha是基於StarCoder微調的首個編程助手模型系列，專注於代碼生成與編程輔助任務

模型特點

代碼微調優化

基於StarCoder基礎模型在編程相關數據集上微調，強化代碼理解與生成能力

多輪對話支持

通過特殊標記支持對話式交互，適合編程問答場景

教育研究導向

專門設計用於探索開源語言模型在編程領域的應用邊界

模型能力

代碼生成

編程問題解答

代碼片段解釋

算法實現建議

使用案例

編程教育

代碼示例生成

根據自然語言描述生成可運行的代碼示例

快速展示編程概念的實際應用

編程問題解答

解釋編程語言特性或解決特定編碼問題

輔助學習者理解複雜概念

研究開發

原型代碼生成

快速生成算法或功能模塊的初始實現

加速研究項目的早期開發階段

🚀 StarChat Alpha模型卡片

StarChat是一系列基於StarCoder微調的語言模型，旨在成為實用的編碼助手。StarChat Alpha是該系列的首個模型，作為Alpha版本，僅用於教育或研究目的。該模型尚未使用如基於人類反饋的強化學習（RLHF）等技術與人類偏好對齊，因此可能會生成有問題的內容（尤其是在被明確要求時）。

🚀 快速開始

使用以下代碼開始使用該模型。

你可以使用🤗 Transformers庫中的pipeline()函數來運行該模型：

import torch
from transformers import pipeline

pipe = pipeline("text-generation", model="HuggingFaceH4/starchat-alpha", torch_dtype=torch.bfloat16, device_map="auto")

prompt_template = "<|system|>\n<|end|>\n<|user|>\n{query}<|end|>\n<|assistant|>"
prompt = prompt_template.format(query="How do I sort a list in Python?")
# We use a special <|end|> token with ID 49155 to denote ends of a turn
outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, eos_token_id=49155)
# You can sort a list in Python by using the sort() method. Here's an example:\n\n```\nnumbers = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]\nnumbers.sort()\nprint(numbers)\n```\n\nThis will sort the list in place and print the sorted list.

✨ 主要特性

模型類型：基於GPT架構的160億參數模型，在oasst1和databricks-dolly-15k數據集的混合數據上進行了微調。
語言：英語
許可證：BigCode Open RAIL - M v1
微調基礎模型：bigcode/starcoderbase

📚 詳細文檔

模型來源

倉庫：https://github.com/bigcode-project/starcoder
演示：https://huggingface.co/spaces/HuggingFaceH4/starchat-playground

使用場景

StarChat Alpha旨在用於教育和/或研究目的，可用於探索開源語言模型的編程能力。

偏差、風險和侷限性

StarChat Alpha尚未使用如RLHF等技術與人類偏好對齊，也沒有像ChatGPT那樣在運行時對回覆進行過濾，因此該模型可能會產生有問題的輸出（尤其是在被明確要求時）。

主要基於代碼數據訓練的模型也會存在與GitHub社區人口統計特徵相關的更明顯的人口統計學偏差，更多信息請參閱源自The Stack的StarCoder數據集。

由於基礎模型是在大量代碼語料庫上進行預訓練的，它可能會生成語法正確但語義錯誤的代碼片段。例如，它可能會生成無法編譯或產生錯誤結果的代碼，也可能會生成存在安全漏洞的代碼。此外，我們還觀察到該模型有生成虛假URL的傾向，點擊前應仔細檢查。

StarChat Alpha是基於基礎模型StarCoder Base進行微調的，請參考其模型卡片的侷限性部分獲取相關信息。特別是，該模型在一些性別偏差類別、毒性傾向以及建議存在已知安全漏洞的代碼補全風險方面進行了評估，這些評估結果在其[技術報告](https://drive.google.com/file/d/1cN - b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view)中有所報告。

📄 許可證

本模型使用BigCode Open RAIL - M v1許可證。

📖 引用

BibTeX：

@article{Tunstall2023starchat-alpha,
  author = {Tunstall, Lewis and Lambert, Nathan and Rajani, Nazneen and Beeching, Edward and Le Scao, Teven and von Werra, Leandro and Han, Sheon and Schmid, Philipp and Rush, Alexander},
  title = {Creating a Coding Assistant with StarCoder},
  journal = {Hugging Face Blog},
  year = {2023},
  note = {https://huggingface.co/blog/starchat},
}