DeepSeek-Coder-V2-Base開源編程AI助手 - 免費編寫、調試與解釋多語言代碼

首頁

Deepseek Coder V2 Base

由deepseek-ai開發

DeepSeek-Coder-V2 是一個專注於編程和代碼任務的AI助手，擅長編寫、調試和解釋多種編程語言的代碼。

大型語言模型

Transformers

開源協議:其他 #編程助手 #多語言代碼支持 #算法實現

下載量 4,588

發布時間 : 4/25/2025

模型概述

該模型主要用於處理編程相關任務，如代碼生成、調試和解釋，支持多種編程語言，並能幫助開發者提高編碼效率。

模型特點

多語言支持

支持多種編程語言，包括Python、C++等，能夠處理不同語言的代碼任務。

代碼調試能力

能夠幫助開發者定位和修復代碼中的錯誤，提供調試建議。

代碼解釋

能夠清晰解釋代碼的功能和邏輯，幫助開發者理解複雜代碼。

模型能力

代碼生成

代碼調試

代碼解釋

算法實現

代碼優化

使用案例

軟件開發

快速排序算法實現

幫助開發者快速實現排序算法，如Python和C++的快速排序代碼。

生成高效且可讀性強的代碼示例。

代碼調試

幫助開發者定位代碼中的邏輯錯誤或語法問題。

提供準確的錯誤定位和修復建議。

教育

編程學習輔助

為學生和初學者提供代碼示例和解釋，幫助理解編程概念。

提高學習效率，降低學習門檻。

🚀 DeepSeek-Coder-V2：突破代碼智能領域閉源模型的壁壘

DeepSeek-Coder-V2 是一個開源的混合專家（MoE）代碼語言模型，在特定代碼任務中表現可與 GPT4-Turbo 相媲美。它在 DeepSeek-V2 的中間檢查點基礎上，額外使用 6 萬億個標記進行了進一步預訓練，顯著增強了編碼和數學推理能力，同時在通用語言任務中保持了相當的性能。與 DeepSeek-Coder-33B 相比，它在代碼相關任務、推理和通用能力等方面都有顯著提升。此外，它支持的編程語言從 86 種擴展到 338 種，上下文長度從 16K 擴展到 128K。

API 平臺 | 使用方法 | 許可證 |

論文鏈接👁️

🚀 快速開始

DeepSeek-Coder-V2 是一個強大的開源代碼語言模型，以下為你介紹它的相關信息和使用方法。

✨ 主要特性

性能卓越：在標準基準評估中，DeepSeek-Coder-V2 在編碼和數學基準測試中表現優於 GPT4-Turbo、Claude 3 Opus 和 Gemini 1.5 Pro 等閉源模型。
能力增強：通過繼續預訓練，大幅提升了 DeepSeek-V2 的編碼和數學推理能力，同時在通用語言任務中保持了相當的性能。
語言擴展：支持的編程語言從 86 種擴展到 338 種，可在更多場景下使用。
上下文長度增加：上下文長度從 16K 擴展到 128K，能夠處理更長的文本輸入。

📦 安裝指南

此部分文檔未提及具體安裝步驟，可參考後續使用示例中的模型加載方式。

💻 使用示例

基礎用法

代碼補全

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = "#write a quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

代碼插入

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Base", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
input_text = """<｜fim▁begin｜>def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[0]
    left = []
    right = []
<｜fim▁hole｜>
        if arr[i] < pivot:
            left.append(arr[i])
        else:
            right.append(arr[i])
    return quick_sort(left) + [pivot] + quick_sort(right)<｜fim▁end｜>"""
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True)[len(input_text):])

聊天補全

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct", trust_remote_code=True, torch_dtype=torch.bfloat16).cuda()
messages=[
    { 'role': 'user', 'content': "write a quick sort algorithm in python."}
]
inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)
# tokenizer.eos_token_id is the id of <｜end▁of▁sentence｜>  token
outputs = model.generate(inputs, max_new_tokens=512, do_sample=False, top_k=50, top_p=0.95, num_return_sequences=1, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True))

完整的聊天模板可以在 huggingface 模型倉庫中的 tokenizer_config.json 中找到。

聊天模板示例如下：

<｜begin▁of▁sentence｜>User: {user_message_1}

Assistant: {assistant_message_1}<｜end▁of▁sentence｜>User: {user_message_2}

Assistant:

你還可以添加一個可選的系統消息：

<｜begin▁of▁sentence｜>{system_message}

User: {user_message_1}

Assistant: {assistant_message_1}<｜end▁of▁sentence｜>User: {user_message_2}

Assistant:

高級用法

使用 vLLM 進行推理（推薦）

要使用 vLLM 進行模型推理，請將此拉取請求合併到你的 vLLM 代碼庫中：https://github.com/vllm-project/vllm/pull/4650。

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams

max_model_len, tp_size = 8192, 1
model_name = "deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)
llm = LLM(model=model_name, tensor_parallel_size=tp_size, max_model_len=max_model_len, trust_remote_code=True, enforce_eager=True)
sampling_params = SamplingParams(temperature=0.3, max_tokens=256, stop_token_ids=[tokenizer.eos_token_id])

messages_list = [
    [{"role": "user", "content": "Who are you?"}],
    [{"role": "user", "content": "write a quick sort algorithm in python."}],
    [{"role": "user", "content": "Write a piece of quicksort code in C++."}],
]

prompt_token_ids = [tokenizer.apply_chat_template(messages, add_generation_prompt=True) for messages in messages_list]

outputs = llm.generate(prompt_token_ids=prompt_token_ids, sampling_params=sampling_params)

generated_text = [output.outputs[0].text for output in outputs]
print(generated_text)

📚 詳細文檔

模型下載

我們基於 DeepSeekMoE 框架發佈了具有 16B 和 236B 參數的 DeepSeek-Coder-V2，其激活參數僅為 2.4B 和 21B，包括基礎模型和指令模型，供公眾使用。

模型	總參數數量	激活參數數量	上下文長度	下載地址
DeepSeek-Coder-V2-Lite-Base	16B	2.4B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Lite-Instruct	16B	2.4B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Base	236B	21B	128k	🤗 HuggingFace
DeepSeek-Coder-V2-Instruct	236B	21B	128k	🤗 HuggingFace