StarChat-βオープンソースプログラミング補助言語モデル - 無料でデプロイ可能、80種以上のプログラミング言語をサポート

ホーム

Starchat Beta

HuggingFaceH4によって開発

StarChat-βはStarCoderPlusをファインチューニングした言語モデルで、プログラミング支援タスクに特化しており、80以上のプログラミング言語をサポート

大規模言語モデル

Transformers

オープンソースライセンス:Openrail #プログラミングアシスタント #多言語コード生成 #検閲なしの対話

ダウンロード数 1,782

リリース時間 : 6/7/2023

モデル概要

このモデルは検閲なし版openassistant-guanacoデータセットでファインチューニングされた160億パラメータのGPT系モデルで、主にプログラミングアシスタントとして使用され、対話機能をサポートしていますがアライメント訓練は未実施

モデル特徴

広範なプログラミング言語サポート

80以上のプログラミング言語のコード生成と理解をサポート

検閲なしトレーニングデータ

検閲なし版データセットでファインチューニングされており、Open LLMリーダーボードでのパフォーマンスが向上

対話型インタラクション

対話形式でのプログラミング問題解決をサポート

モデル能力

コード生成

プログラミング問題解決

コード解説

技術文書理解

多言語プログラミングサポート

使用事例

開発支援

コードスニペット生成

自然言語の記述から実行可能なコードスニペットを生成

複数のプログラミング言語で文法正しいコードを生成可能

コードデバッグ支援

コードエラーを解説し修正提案を提供

一般的な文法エラーや論理問題を識別可能

教育

プログラミング学習支援

プログラミング学習中の概念的な質問に回答

多言語プログラミング概念の説明と例を提供

🚀 StarChat-β

StarChatは、役立つコーディングアシスタントとして機能するように学習された一連の言語モデルです。StarChat-βは、このシリーズの2番目のモデルで、StarCoderPlusを微調整したもので、openassistant-guanacoデータセットの"無制限"バリアントで学習されています。OpenAssistantデータセットの組み込みアラインメントを削除することで、Open LLM Leaderboardでのパフォーマンスが向上し、コーディングタスクでの役立ちが増したことがわかりました。ただし、これはモデルが要求された場合に問題のあるテキストを生成する可能性があり、教育および研究目的でのみ使用すべきであることを意味します。

🚀 クイックスタート

このモデルは、OpenAssistant/oasst1データセットのバリアントで微調整されており、35以上の言語の多様な対話が含まれています。そのため、チャットに使用でき、コーディング機能をテストするには、デモを参照できます。

以下は、🤗 Transformersのpipeline()関数を使用してモデルを実行する方法です。

import torch
from transformers import pipeline

pipe = pipeline("text-generation", model="HuggingFaceH4/starchat-beta", torch_dtype=torch.bfloat16, device_map="auto")

# We use a variant of ChatML to format each message
prompt_template = "<|system|>\n<|end|>\n<|user|>\n{query}<|end|>\n<|assistant|>"
prompt = prompt_template.format(query="How do I sort a list in Python?")
# We use a special <|end|> token with ID 49155 to denote ends of a turn
outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, eos_token_id=49155)
# You can sort a list in Python by using the sort() method. Here's an example:\n\n```\nnumbers = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]\nnumbers.sort()\nprint(numbers)\n```\n\nThis will sort the list in place and print the sorted list.

✨ 主な機能

StarChat-βは、コーディングアシスタントとして機能するように学習された言語モデルです。主に英語と80以上のプログラミング言語に対応しており、コーディングタスクでの役立ちが高いです。

📚 ドキュメント

モデルの詳細

モデルの説明

属性	详情
モデルタイプ	160億パラメータのGPTライクなモデルで、`openassistant-guanaco`データセットの"無制限"バリアントで微調整されています。
言語	主に英語と80以上のプログラミング言語
ライセンス	BigCode Open RAIL-M v1
微調整元のモデル	bigcode/starcoderplus

モデルのソース

リポジトリ: https://github.com/bigcode-project/starcoder
デモ: https://huggingface.co/spaces/HuggingFaceH4/starchat-playground

バイアス、リスク、および制限

StarChat-βは、RLHFのような手法で人間の好みにアラインメントされておらず、ChatGPTのように応答のループ内フィルタリングを行っていないため、問題のある出力を生成する可能性があります（特にそのように促された場合）。主にコードデータで学習されたモデルは、GitHubコミュニティの人口統計に応じて、より歪んだ人口統計的バイアスを持つことになります。詳細については、The Stackから派生したStarCoderデータセットを参照してください。

ベースモデルは大量のコードコーパスで事前学習されているため、構文的には有効だが意味的には誤ったコードスニペットを生成する可能性があります。たとえば、コンパイルできないコードや誤った結果を生成するコードを生成する可能性があります。また、セキュリティ上の脆弱性のあるコードを生成する可能性もあります。モデルはまた、誤ったURLを生成する傾向があり、クリックする前に注意深く検査する必要があります。

StarChat-βは、ベースモデルのStarCoderPlusから微調整されています。関連情報については、そのモデルカードの制限事項セクションを参照してください。特に、モデルは性別バイアスのいくつかのカテゴリ、毒性の傾向、および既知のセキュリティ欠陥を持つコード補完を提案するリスクについて評価されており、これらの評価は技術レポートに報告されています。

学習と評価データ

StarChat-βは、openassistant-guanacoデータセットの"無制限"バリアントで学習されています。WizardLMの背後にあるShareGPTデータセットをフィルタリングするために使用される同じレシピを適用しています。

学習手順

学習ハイパーパラメータ

学習中に以下のハイパーパラメータが使用されました。

学習率: 2e-05
学習バッチサイズ: 4
評価バッチサイズ: 4
シード: 42
分散タイプ: マルチGPU
デバイス数: 8
勾配累積ステップ: 8
総学習バッチサイズ: 256
総評価バッチサイズ: 32
オプティマイザ: Adam（ベータ=(0.9,0.999)、イプシロン=1e-08）
学習率スケジューラタイプ: コサイン
学習率スケジューラウォームアップ比率: 0.03
エポック数: 6

学習結果

学習損失	エポック	ステップ	検証損失
1.5321	0.98	15	1.2856
1.2071	1.97	30	1.2620
1.0162	2.95	45	1.2853
0.8484	4.0	61	1.3274
0.6981	4.98	76	1.3994
0.5668	5.9	90	1.4720

フレームワークバージョン

Transformers 4.28.1
Pytorch 2.0.1+cu118
Datasets 2.12.0
Tokenizers 0.13.3

引用

StarChat-βに関連するブログ記事や論文はありませんが、以前のバージョンの詳細は以下のブログ記事で見つけることができます。

BibTeX:

@article{Tunstall2023starchat-alpha,
  author = {Tunstall, Lewis and Lambert, Nathan and Rajani, Nazneen and Beeching, Edward and Le Scao, Teven and von Werra, Leandro and Han, Sheon and Schmid, Philipp and Rush, Alexander},
  title = {Creating a Coding Assistant with StarCoder},
  journal = {Hugging Face Blog},
  year = {2023},
  note = {https://huggingface.co/blog/starchat},
}