EvolCodeLlama-7bオープンソースコード生成モデル - 無料で高品質なPythonコードを生成する

ホーム

Evolcodellama 7b

mlabonneによって開発

CodeLlama-7b-hfモデルをベースに、QLoRA（4ビット精度）でEvol-Instruct-Python-1kデータセット上でファインチューニングされたコード生成モデル

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #Pythonコード生成 #QLoRAファインチューニング #4ビット量子化

ダウンロード数 34

リリース時間 : 8/25/2023

モデル概要

このモデルはPythonコード生成タスクに最適化された軽量言語モデルで、主に教育デモ目的で使用されます。進化命令ファインチューニング技術によりコード生成能力を強化しています。

モデル特徴

4ビットQLoRAファインチューニング

4ビット量子化技術を採用した効率的なファインチューニングで、VRAM要件を大幅に削減

進化命令最適化

Evol-Instructメソッドを使用して複雑なコード命令の理解能力を強化

軽量デプロイ

7Bパラメータ規模はコンシューマーGPU（RTX 3090など）での実行に適しています

モデル能力

Pythonコード生成

コード補完

命令追従

使用事例

教育デモ

プログラミング教育補助

コード生成モデルの原理と応用をデモンストレーションするために使用

開発ツール

コードスニペット生成

自然言語記述に基づいてPythonコードスニペットを生成

🚀 🦙💻 EvolCodeLlama-7b

このモデルは、mlabonne/Evol-Instruct-Python-1k データセットを使用して、QLoRA（4ビット精度）でファインチューニングされた codellama/CodeLlama-7b-hf モデルです。主に教育目的で設計されており、推論用途ではないことに注意してください。

📝 記事

🚀 クイックスタート

このモデルは、特定のデータセットを用いてファインチューニングされたもので、教育目的での使用を想定しています。以下のセクションでは、トレーニングの詳細と使用方法について説明します。

✨ 主な機能

特定のPythonデータセットを使用してファインチューニングされています。
教育目的での使用に最適化されています。

📦 インストール

使用するには、必要なライブラリをインストールする必要があります。以下のコマンドを実行してください。

pip install transformers accelerate

💻 使用例

基本的な使用法

# pip install transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "mlabonne/EvolCodeLlama-7b"
prompt = "Your prompt"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    f'{prompt}',
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

🔧 技術詳細

トレーニング環境

このモデルはRTX 3090で1時間11分44秒かけてトレーニングされました。以下はトレーニングに使用された設定ファイルです。

base_model: codellama/CodeLlama-7b-hf
base_model_config: codellama/CodeLlama-7b-hf
model_type: LlamaForCausalLM
tokenizer_type: LlamaTokenizer
is_llama_derived_model: true
hub_model_id: EvolCodeLlama-7b

load_in_8bit: false
load_in_4bit: true
strict: false

datasets:
  - path: mlabonne/Evol-Instruct-Python-1k
    type: alpaca
dataset_prepared_path: last_run_prepared
val_set_size: 0.02
output_dir: ./qlora-out

adapter: qlora
lora_model_dir:

sequence_len: 2048
sample_packing: true

lora_r: 32
lora_alpha: 16
lora_dropout: 0.05
lora_target_modules:
lora_target_linear: true
lora_fan_in_fan_out:

wandb_project: axolotl
wandb_entity:
wandb_watch:
wandb_run_id:
wandb_log_model:

gradient_accumulation_steps: 1
micro_batch_size: 10
num_epochs: 3
optimizer: paged_adamw_32bit
lr_scheduler: cosine
learning_rate: 0.0002

train_on_inputs: false
group_by_length: false
bf16: true
fp16: false
tf32: false

gradient_checkpointing: true
early_stopping_patience:
resume_from_checkpoint:
local_rank:
logging_steps: 1
xformers_attention:
flash_attention: true

warmup_steps: 100
eval_steps: 0.01
save_strategy: epoch
save_steps:
debug:
deepspeed:
weight_decay: 0.0
fsdp:
fsdp_config:
special_tokens:
  bos_token: "<s>"
  eos_token: "</s>"
  unk_token: "<unk>"