Magicoder-DS-6.7B开源代码生成模型 - 借开源片段启发产出高质量代码

首页

Magicoder DS 6.7B

由 ise-uiuc 开发

Magicoder是由OSS-Instruct技术驱动的代码生成模型家族，通过开源代码片段启发LLM生成高质量代码指令数据

大型语言模型

Transformers

开源协议:其他 #开源代码生成 #低偏差指令 #编程助手

下载量 151

发布时间 : 12/3/2023

模型简介

Magicoder是一个专为编码任务设计的模型，采用OSS-Instruct技术生成低偏差、高质量的代码指令数据

模型特点

OSS-Instruct技术

通过开源代码片段启发LLM，生成低偏差和高质量的代码指令数据

高质量训练数据

使用Magicoder-OSS-Instruct-75K数据集训练，包含75K条高质量代码指令

代码生成能力

专为编码任务优化，能够持续准确地响应代码相关指令

模型能力

代码生成

代码补全

编程问题解答

使用案例

软件开发

代码辅助开发

帮助开发者快速生成代码片段

提高开发效率

编程学习

解答编程学习中的问题

辅助编程教育

🚀 🎩 Magicoder: 源代码即所需一切

Magicoder是一个模型家族，借助新颖的OSS-Instruct方法，利用开源代码片段启发大语言模型，生成低偏差、高质量的代码指令数据。该方法通过大量开源参考减少了大语言模型合成指令数据的固有偏差，能生成更多样、真实且可控的数据。

🚀 快速开始

使用以下代码开始使用该模型。请确保你已经安装了 transformers 库。

from transformers import pipeline
import torch

MAGICODER_PROMPT = """You are an exceptionally intelligent coding assistant that consistently delivers accurate and reliable responses to user instructions.

@@ Instruction
{instruction}

@@ Response
"""

instruction = <Your code instruction here>

prompt = MAGICODER_PROMPT.format(instruction=instruction)
generator = pipeline(
    model="ise-uiuc/Magicoder-DS-6.7B",
    task="text-generation",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
result = generator(prompt, max_length=1024, num_return_sequences=1, temperature=0.0)
print(result[0]["generated_text"])

✨ 主要特性

🎩 Magicoder 是一个模型家族，借助 🪄 OSS-Instruct 方法，利用开源代码片段启发大语言模型，生成低偏差、高质量的代码指令数据。
🪄 OSS-Instruct 通过大量开源参考减少了大语言模型合成指令数据的固有偏差，能生成更多样、真实且可控的数据。

📚 详细文档

模型详情

模型描述

属性	详情
开发者	Yuxiang Wei、Zhe Wang、Jiawei Liu、Yifeng Ding、Lingming Zhang
许可证	DeepSeek
微调基础模型	deepseek-coder-6.7b-base

模型来源

仓库：https://github.com/ise-uiuc/magicoder
论文：https://arxiv.org/abs/2312.02120
演示（由 Gradio 提供支持）：https://github.com/ise-uiuc/magicoder/tree/main/demo

训练数据

Magicoder-OSS-Instruct-75K：通过 OSS-Instruct 使用 gpt-3.5-turbo-1106 生成，用于训练 Magicoder 和 Magicoder-S 系列。

使用场景

直接使用

Magicoder 专为 编码任务 设计，在编码任务中表现最佳。

不适用场景

Magicoder 在非编码任务中可能表现不佳。

偏差、风险和局限性

Magicoder 有时可能会出错，产生误导性内容，或者在处理与编码无关的任务时遇到困难。

建议

用户（直接用户和下游用户）应该了解该模型的风险、偏差和局限性。

技术细节

请参考我们的 GitHub 仓库：ise-uiuc/magicoder。

📝 引用

@misc{magicoder,
    title={Magicoder: Source Code Is All You Need}, 
    author={Yuxiang Wei and Zhe Wang and Jiawei Liu and Yifeng Ding and Lingming Zhang},
    year={2023},
    eprint={2312.02120},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}