starcoder2-15b-instruct-v0.1 オープンソースコード大規模言語モデル - 単輪プログラミング命令に対する無料デプロイレスポンス

ホーム

Starcoder2 15b Instruct V0.1

bigcodeによって開発

完全にオープンで透明なプロセスで訓練された初の自己整合コード大規模言語モデルで、単一ラウンドのプログラミング指示応答専用に設計

大規模言語モデル

Transformers

その他オープンソースライセンス:Openrail #自己整合コード生成 #Pythonプログラミングアシスタント #実行検証最適化

ダウンロード数 1,371

リリース時間 : 4/23/2024

モデル概要

StarCoder2-15B-InstructはStarCoder2-15B自身が生成した指示-応答ペアで微調整されたコード生成モデルで、人間の注釈やクローズドソースモデルの蒸留データを一切必要としません

モデル特徴

完全に透明な自己整合プロセス

StarCoder2自身で訓練データを生成し、人間の注釈やクローズドソースモデルの蒸留に依存しない

実行検証によるデータフィルタリング

生成されたコード応答を実際に実行して検証し、訓練データの品質を確保

オープンソースコードとデータ

訓練プロセス、コードリポジトリ、データセットを完全公開

高性能コード生成

HumanEval、MBPPなどのベンチマークで優れた性能を発揮

モデル能力

Pythonコード生成

型ヒント付きコード生成

コード補完

アルゴリズム実装

関数生成

使用事例

プログラミング支援

アルゴリズム実装

自然言語の記述からアルゴリズム実装コードを生成

HumanEvalベンチマークで72.6% pass@1を達成

コード補完

関数シグネチャや部分コードから完全な実装を生成

MBPPベンチマークで75.2% pass@1を達成

教育

プログラミング教育

教育用サンプルコードと演習問題を生成

🚀 StarCoder2-Instruct: コード生成のための完全透明かつ許容的な自己アライメント

完全に許容的で透明なパイプラインでトレーニングされた、最初の完全に自己アライメントされたコード生成用大規模言語モデルです。

🚀 クイックスタート

このモデルは、コード生成に特化した大規模言語モデルです。完全に自己アライメントされ、透明なパイプラインでトレーニングされています。以下に、モデルの基本情報を示します。

属性	详情
パイプラインタグ	テキスト生成
ベースモデル	bigcode/starcoder2-15b
データセット	bigcode/self-oss-instruct-sc2-exec-filter-50k
ライセンス	bigcode-openrail-m
ライブラリ名	transformers
タグ	コード

モデルの概要

StarCoder2-15B-Instruct-v0.1は、完全に自己アライメントされたコード生成用大規模言語モデルです。このオープンソースのパイプラインは、StarCoder2-15Bを使用して数千の命令応答ペアを生成し、それを使用してStarCoder-15B自体を微調整します。この過程では、人間によるアノテーションや、巨大で独自の大規模言語モデルからの蒸留データは使用されていません。

モデル: bigcode/starcoder2-15b-instruct-v0.1
コード: bigcode-project/starcoder2-self-align
データセット: bigcode/self-oss-instruct-sc2-exec-filter-50k
著者: Yuxiang Wei, Federico Cassano, Jiawei Liu, Yifeng Ding, Naman Jain, Harm de Vries, Leandro von Werra, Arjun Guha, Lingming Zhang.

自己アライメントパイプライン

引用

@article{wei2024selfcodealign,
  title={SelfCodeAlign: Self-Alignment for Code Generation}, 
  author={Yuxiang Wei and Federico Cassano and Jiawei Liu and Yifeng Ding and Naman Jain and Zachary Mueller and Harm de Vries and Leandro von Werra and Arjun Guha and Lingming Zhang},
  year={2024},
  journal={arXiv preprint arXiv:2410.24198}
}

💻 使用例

基本的な使用法

このモデルは、コーディング関連の命令に対して単一ターンで応答するように設計されています。他のスタイルの命令では、応答の精度が低下する可能性があります。

以下は、transformersライブラリを使用してモデルを使用する例です。

import transformers
import torch

pipeline = transformers.pipeline(
    model="bigcode/starcoder2-15b-instruct-v0.1",
    task="text-generation",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

def respond(instruction: str, response_prefix: str) -> str:
    messages = [{"role": "user", "content": instruction}]
    prompt = pipeline.tokenizer.apply_chat_template(messages, tokenize=False)
    prompt += response_prefix

    teminators = [
        pipeline.tokenizer.eos_token_id,
        pipeline.tokenizer.convert_tokens_to_ids("###"),
    ]

    result = pipeline(
        prompt,
        max_length=256,
        num_return_sequences=1,
        do_sample=False,
        eos_token_id=teminators,
        pad_token_id=pipeline.tokenizer.eos_token_id,
        truncation=True,
    )
    response = response_prefix + result[0]["generated_text"][len(prompt) :].split("###")[0].rstrip()
    return response


instruction = "Write a quicksort function in Python with type hints and a 'less_than' parameter for custom sorting criteria."
response_prefix = ""

print(respond(instruction, response_prefix))

以下は、期待される出力です。

Here's how you can implement a quicksort function in Python with type hints and a 'less_than' parameter for custom sorting criteria:

```python
from typing import TypeVar, Callable

T = TypeVar('T')

def quicksort(items: list[T], less_than: Callable[[T, T], bool] = lambda x, y: x < y) -> list[T]:
    if len(items) <= 1:
        return items

    pivot = items[0]
    less = [x for x in items[1:] if less_than(x, pivot)]
    greater = [x for x in items[1:] if not less_than(x, pivot)]
    return quicksort(less, less_than) + [pivot] + quicksort(greater, less_than)
```

バイアス、リスク、および制限

StarCoder2-15B-Instruct-v0.1は、主に実行を通じて検証できるPythonコード生成タスクに対して微調整されています。このため、特定のバイアスや制限が生じる可能性があります。たとえば、モデルは出力形式を指定する命令に厳密に従わない場合があります。このような場合、応答プレフィックスまたはワンショット例を提供すると、モデルの出力を誘導するのに役立ちます。また、モデルは他のプログラミング言語やドメイン外のコーディングタスクに対して制限がある可能性があります。

このモデルは、ベースのStarCoder2-15Bモデルからバイアス、リスク、および制限を引き継いでいます。詳細については、StarCoder2-15Bモデルカードを参照してください。

評価

EvalPlus

LiveCodeBench and DS-1000

🔧 技術詳細

ハイパーパラメータ

オプティマイザ: Adafactor
学習率: 1e-5
エポック数: 4
バッチサイズ: 64
ウォームアップ率: 0.05
スケジューラ: Linear
シーケンス長: 1280
ドロップアウト: 適用なし

ハードウェア

1 x NVIDIA A100 80GB

リソース

モデル: bigcode/starCoder2-15b-instruct-v0.1
コード: bigcode-project/starcoder2-self-align
データセット: bigcode/self-oss-instruct-sc2-exec-filter-50k

完全なデータパイプライン

データセット生成パイプラインにはいくつかのステップがあります。パイプラインの各ステップに対して中間データセットを提供しています。

The Stack v1からフィルタリングされた元のシードデータセット: https://huggingface.co/datasets/bigcode/python-stack-v1-functions-filtered
StarCoder2-15Bを判定器として使用して、不適切なドキュメント文字列を持つアイテムを削除したシードデータセット: https://huggingface.co/datasets/bigcode/python-stack-v1-functions-filtered-sc2
シード -> 概念: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-concepts
概念 -> 命令: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-instructions
命令 -> 応答: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-responses-unfiltered
実行によってフィルタリングされた応答: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-500k-raw
重複排除によってフィルタリングされた実行済み応答 (最終データセット): https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50k