EvolCodeLlama-7b開源代碼生成模型 - 免費生成高質量Python代碼

首頁

Evolcodellama 7b

由mlabonne開發

基於CodeLlama-7b-hf模型，採用QLoRA（4比特精度）在Evol-Instruct-Python-1k數據集上微調而成的代碼生成模型

大型語言模型

Transformers

開源協議:Apache-2.0 #Python代碼生成 #QLoRA微調 #4比特量化

下載量 34

發布時間 : 8/25/2023

模型概述

本模型是針對Python代碼生成任務優化的輕量級語言模型，主要用於教學演示目的。通過進化指令微調技術增強代碼生成能力。

模型特點

4比特QLoRA微調

採用4比特量化技術進行高效微調，顯著降低顯存需求

進化指令優化

使用Evol-Instruct方法增強模型對複雜代碼指令的理解能力

輕量級部署

7B參數規模適合在消費級GPU（如RTX 3090）上運行

模型能力

Python代碼生成

代碼補全

指令跟隨

使用案例

教育演示

編程教學輔助

用於演示代碼生成模型的原理和應用

開發工具

代碼片段生成

根據自然語言描述生成Python代碼片段

🚀 🦙💻 EvolCodeLlama-7b

🦙💻 EvolCodeLlama-7b 是一個基於微調技術的模型，它在代碼生成領域有著獨特的優勢。該模型以 codellama/CodeLlama-7b-hf 為基礎，通過在特定數據集上的精細調整，能夠更好地滿足用戶在代碼生成方面的需求，為開發者和研究者提供了一個強大的工具。

🚀 快速開始

本模型是基於 codellama/CodeLlama-7b-hf 模型，使用 QLoRA（4 位精度）在 mlabonne/Evol-Instruct-Python-1k 數據集上進行微調得到的。

📝 文章鏈接

🔧 訓練細節

該模型在 RTX 3090 上進行訓練，耗時 1 小時 11 分 44 秒，使用了以下配置文件：

base_model: codellama/CodeLlama-7b-hf
base_model_config: codellama/CodeLlama-7b-hf
model_type: LlamaForCausalLM
tokenizer_type: LlamaTokenizer
is_llama_derived_model: true
hub_model_id: EvolCodeLlama-7b

load_in_8bit: false
load_in_4bit: true
strict: false

datasets:
  - path: mlabonne/Evol-Instruct-Python-1k
    type: alpaca
dataset_prepared_path: last_run_prepared
val_set_size: 0.02
output_dir: ./qlora-out

adapter: qlora
lora_model_dir:

sequence_len: 2048
sample_packing: true

lora_r: 32
lora_alpha: 16
lora_dropout: 0.05
lora_target_modules:
lora_target_linear: true
lora_fan_in_fan_out:

wandb_project: axolotl
wandb_entity:
wandb_watch:
wandb_run_id:
wandb_log_model:

gradient_accumulation_steps: 1
micro_batch_size: 10
num_epochs: 3
optimizer: paged_adamw_32bit
lr_scheduler: cosine
learning_rate: 0.0002

train_on_inputs: false
group_by_length: false
bf16: true
fp16: false
tf32: false

gradient_checkpointing: true
early_stopping_patience:
resume_from_checkpoint:
local_rank:
logging_steps: 1
xformers_attention:
flash_attention: true

warmup_steps: 100
eval_steps: 0.01
save_strategy: epoch
save_steps:
debug:
deepspeed:
weight_decay: 0.0
fsdp:
fsdp_config:
special_tokens:
  bos_token: "<s>"
  eos_token: "</s>"
  unk_token: "<unk>"

以下是訓練過程中的損失曲線：

該模型主要用於教育目的，而非推理。

💻 使用示例

基礎用法

# pip install transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "mlabonne/EvolCodeLlama-7b"
prompt = "Your prompt"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    f'{prompt}',
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")