EvolCodeLlama-7b开源代码生成模型 - 免费生成高质量Python代码

Home

Evolcodellama 7b

Developed by mlabonne

基于CodeLlama-7b-hf模型，采用QLoRA（4比特精度）在Evol-Instruct-Python-1k数据集上微调而成的代码生成模型

大型语言模型

Transformers

Open Source License:Apache-2.0 #Python代码生成 #QLoRA微调 #4比特量化

Downloads 34

Release Time : 8/25/2023

Model Overview

本模型是针对Python代码生成任务优化的轻量级语言模型，主要用于教学演示目的。通过进化指令微调技术增强代码生成能力。

Model Features

4比特QLoRA微调

采用4比特量化技术进行高效微调，显著降低显存需求

进化指令优化

使用Evol-Instruct方法增强模型对复杂代码指令的理解能力

轻量级部署

7B参数规模适合在消费级GPU（如RTX 3090）上运行

Model Capabilities

Python代码生成

代码补全

指令跟随

Use Cases

教育演示

编程教学辅助

用于演示代码生成模型的原理和应用

开发工具

代码片段生成

根据自然语言描述生成Python代码片段

🚀 🦙💻 EvolCodeLlama-7b

🦙💻 EvolCodeLlama-7b 是一个基于微调技术的模型，它在代码生成领域有着独特的优势。该模型以 codellama/CodeLlama-7b-hf 为基础，通过在特定数据集上的精细调整，能够更好地满足用户在代码生成方面的需求，为开发者和研究者提供了一个强大的工具。

🚀 快速开始

本模型是基于 codellama/CodeLlama-7b-hf 模型，使用 QLoRA（4 位精度）在 mlabonne/Evol-Instruct-Python-1k 数据集上进行微调得到的。

📝 文章链接

🔧 训练细节

该模型在 RTX 3090 上进行训练，耗时 1 小时 11 分 44 秒，使用了以下配置文件：

base_model: codellama/CodeLlama-7b-hf
base_model_config: codellama/CodeLlama-7b-hf
model_type: LlamaForCausalLM
tokenizer_type: LlamaTokenizer
is_llama_derived_model: true
hub_model_id: EvolCodeLlama-7b

load_in_8bit: false
load_in_4bit: true
strict: false

datasets:
  - path: mlabonne/Evol-Instruct-Python-1k
    type: alpaca
dataset_prepared_path: last_run_prepared
val_set_size: 0.02
output_dir: ./qlora-out

adapter: qlora
lora_model_dir:

sequence_len: 2048
sample_packing: true

lora_r: 32
lora_alpha: 16
lora_dropout: 0.05
lora_target_modules:
lora_target_linear: true
lora_fan_in_fan_out:

wandb_project: axolotl
wandb_entity:
wandb_watch:
wandb_run_id:
wandb_log_model:

gradient_accumulation_steps: 1
micro_batch_size: 10
num_epochs: 3
optimizer: paged_adamw_32bit
lr_scheduler: cosine
learning_rate: 0.0002

train_on_inputs: false
group_by_length: false
bf16: true
fp16: false
tf32: false

gradient_checkpointing: true
early_stopping_patience:
resume_from_checkpoint:
local_rank:
logging_steps: 1
xformers_attention:
flash_attention: true

warmup_steps: 100
eval_steps: 0.01
save_strategy: epoch
save_steps:
debug:
deepspeed:
weight_decay: 0.0
fsdp:
fsdp_config:
special_tokens:
  bos_token: "<s>"
  eos_token: "</s>"
  unk_token: "<unk>"

以下是训练过程中的损失曲线：

该模型主要用于教育目的，而非推理。

💻 使用示例

基础用法

# pip install transformers accelerate

from transformers import AutoTokenizer
import transformers
import torch

model = "mlabonne/EvolCodeLlama-7b"
prompt = "Your prompt"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    f'{prompt}',
    do_sample=True,
    top_k=10,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")