DeepSeek-Coder-V2-Base开源编程AI助手 - 免费编写、调试与解释多语言代码

首页

Deepseek Coder V2 Base

由 deepseek-ai 开发

DeepSeek-Coder-V2 是一个专注于编程和代码任务的AI助手，擅长编写、调试和解释多种编程语言的代码。

大型语言模型

Transformers

开源协议:其他 #编程助手 #多语言代码支持 #算法实现

下载量 4,588

发布时间 : 4/25/2025

模型简介

该模型主要用于处理编程相关任务，如代码生成、调试和解释，支持多种编程语言，并能帮助开发者提高编码效率。

模型特点

多语言支持

支持多种编程语言，包括Python、C++等，能够处理不同语言的代码任务。

代码调试能力

能够帮助开发者定位和修复代码中的错误，提供调试建议。

代码解释

能够清晰解释代码的功能和逻辑，帮助开发者理解复杂代码。

模型能力

代码生成

代码调试

代码解释

算法实现

代码优化

使用案例

软件开发

快速排序算法实现

帮助开发者快速实现排序算法，如Python和C++的快速排序代码。

生成高效且可读性强的代码示例。

代码调试

帮助开发者定位代码中的逻辑错误或语法问题。

提供准确的错误定位和修复建议。

教育

编程学习辅助

为学生和初学者提供代码示例和解释，帮助理解编程概念。

提高学习效率，降低学习门槛。

🚀 DeepSeek-Coder-V2：突破代码智能领域闭源模型的壁垒

DeepSeek-Coder-V2 是一个开源的混合专家（MoE）代码语言模型，在特定代码任务中表现可与 GPT4-Turbo 相媲美。它在 DeepSeek-V2 的中间检查点基础上，额外使用 6 万亿个标记进行了进一步预训练，显著增强了编码和数学推理能力，同时在通用语言任务中保持了相当的性能。与 DeepSeek-Coder-33B 相比，它在代码相关任务、推理和通用能力等方面都有显著提升。此外，它支持的编程语言从 86 种扩展到 338 种，上下文长度从 16K 扩展到 128K。

API 平台 | 使用方法 | 许可证 |

论文链接👁️

🚀 快速开始

DeepSeek-Coder-V2 是一个强大的开源代码语言模型，以下为你介绍它的相关信息和使用方法。

✨ 主要特性

性能卓越：在标准基准评估中，DeepSeek-Coder-V2 在编码和数学基准测试中表现优于 GPT4-Turbo、Claude 3 Opus 和 Gemini 1.5 Pro 等闭源模型。
能力增强：通过继续预训练，大幅提升了 DeepSeek-V2 的编码和数学推理能力，同时在通用语言任务中保持了相当的性能。
语言扩展：支持的编程语言从 86 种扩展到 338 种，可在更多场景下使用。
上下文长度增加：上下文长度从 16K 扩展到 128K，能够处理更长的文本输入。

📦 安装指南

此部分文档未提及具体安装步骤，可参考后续使用示例中的模型加载方式。

💻 使用示例

基础用法

代码补全

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = "#write a quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

代码插入

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = """<｜fim▁begin｜>def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = []
    right = []
<｜fim▁hole｜>
        if arr[i] < pivot:
            left.append(arr[i])
        else:
            right.append(arr[i])
    return quick_sort(left) + [pivot] + quick_sort(right)<｜fim▁end｜>"""
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True)[len(input_text):])

聊天补全

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
messages=[
    { 'role': 'user', 'content': "write a quick sort algorithm in python."}
]
inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
# tokenizer.eos_token_id is the id of <｜end▁of▁sentence｜>  token
outputs = model.generate(inputs, max_new_tokens=512, do_sample=False, top_k=50, top_p=0.95, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True))

完整的聊天模板可以在 huggingface 模型仓库中的 tokenizer_config.json 中找到。

聊天模板示例如下：

<｜begin▁of▁sentence｜>User: {user_message_1}

Assistant: {assistant_message_1}<｜end▁of▁sentence｜>User: {user_message_2}

Assistant:

你还可以添加一个可选的系统消息：

<｜begin▁of▁sentence｜>{system_message}

User: {user_message_1}

Assistant: {assistant_message_1}<｜end▁of▁sentence｜>User: {user_message_2}

Assistant:

高级用法

使用 vLLM 进行推理（推荐）

要使用 vLLM 进行模型推理，请将此拉取请求合并到你的 vLLM 代码库中：https://github.com/vllm-project/vllm/pull/4650。

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams

max_model_len, tp_size = 8192, 1
model_name = "deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
llm = LLM(model=model_name, tensor_parallel_size=tp_size, max_model_len=max_model_len, trust_remote_code=True, enforce_eager=True)
sampling_params = SamplingParams(temperature=0.3, max_tokens=256, stop_token_ids=[tokenizer.eos_token_id])

messages_list = [
    [{"role": "user", "content": "Who are you?"}],
    [{"role": "user", "content": "write a quick sort algorithm in python."}],
    [{"role": "user", "content": "Write a piece of quicksort code in C++."}],
]

prompt_token_ids = [tokenizer.apply_chat_template(messages, add_generation_prompt=True) for messages in messages_list]

outputs = llm.generate(prompt_token_ids=prompt_token_ids, sampling_params=sampling_params)

generated_text = [output.outputs[0].text for output in outputs]
print(generated_text)

📚 详细文档

模型下载

我们基于 DeepSeekMoE 框架发布了具有 16B 和 236B 参数的 DeepSeek-Coder-V2，其激活参数仅为 2.4B 和 21B，包括基础模型和指令模型，供公众使用。

模型	总参数数量	激活参数数量	上下文长度	下载地址
DeepSeek-Coder-V2-Lite-Base	16B	2.4B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Lite-Instruct	16B	2.4B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Base	236B	21B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Instruct	236B	21B	128k	🤗 HuggingFace