Devstral-Small-2505開源模型 - 助力軟件工程，支持代碼探索與多文件編輯

首頁

Devstral Small 2505

由unsloth開發

Devstral是一款專為軟件工程任務設計的智能大語言模型，由Mistral AI和All Hands AI合作開發，擅長代碼探索、多文件編輯和驅動軟件工程智能體。

大型語言模型

Safetensors

支持多種語言開源協議:Apache-2.0 #智能編碼助手 #128K長上下文 #輕量級部署

下載量 317

發布時間 : 5/21/2025

模型概述

Devstral是基於Mistral-Small-3.1微調而來的編碼專用模型，具備128k token上下文窗口，是SWE-bench基準測試中表現最佳的開源模型。

模型特點

智能編碼能力

專為軟件工程任務優化，擅長代碼探索、多文件編輯和驅動編碼智能體

輕量化設計

240億參數規模，可在RTX 4090或32GB內存Mac等設備本地運行

長上下文支持

128k token的上下文窗口，適合處理大型代碼庫

開源許可

採用Apache 2.0許可證，允許商業和非商業用途的修改和使用

模型能力

代碼生成

代碼編輯

多文件處理

軟件工程任務自動化

代碼庫探索

使用案例

軟件開發

構建待辦事項應用

使用FastAPI和React構建全棧應用，包括前端UI和後端數據庫

可生成完整可運行的應用代碼

代碼重構

自動化重構現有代碼庫，提高代碼質量和可維護性

教育

編程教學助手

幫助學生理解和解決編程問題，提供代碼示例和解釋

🚀 MistralAI Devstral-Small-2505模型

Devstral是一款專為軟件工程任務打造的大語言模型（LLM），由Mistral AI和All Hands AI合作開發🙌。它在探索代碼庫、編輯多個文件以及驅動軟件工程智能體等方面表現出色。該模型在SWE-bench基準測試中取得了顯著成績，成為該基準測試中的開源模型第一名。

它基於Mistral-Small-3.1進行微調，因此擁有長達128k token的上下文窗口。作為一個僅處理文本的編碼智能體，在從Mistral-Small-3.1微調之前，其視覺編碼器已被移除。

對於有特殊需求（如增加上下文、特定領域知識等）的企業，我們將發佈商業模型，其功能將超越Mistral AI向社區貢獻的版本。

您可以在我們的博客文章中瞭解更多關於Devstral的信息。

🚀 快速開始

環境準備

確保您的環境滿足以下要求：

支持的語言：英語、法語、德語、西班牙語、葡萄牙語、意大利語、日語、韓語、俄語、中文、阿拉伯語、波斯語、印尼語、馬來語、尼泊爾語、波蘭語、羅馬尼亞語、塞爾維亞語、瑞典語、土耳其語、烏克蘭語、越南語、印地語、孟加拉語。
許可證：Apache 2.0許可證。
依賴庫：建議使用vllm庫進行推理。

模型使用

您可以通過API或本地運行的方式使用Devstral。具體步驟如下：

API方式：
- 按照說明創建Mistral賬戶並獲取API密鑰。
- 運行以下命令啟動OpenHands Docker容器：

export MISTRAL_API_KEY=<MY_KEY>

docker pull docker.all-hands.dev/all-hands-ai/runtime:0.39-nikolaik

mkdir -p ~/.openhands-state && echo '{"language":"en","agent":"CodeActAgent","max_iterations":null,"security_analyzer":null,"confirmation_mode":false,"llm_model":"mistral/devstral-small-2505","llm_api_key":"'$MISTRAL_API_KEY'","remote_runtime_resource_factor":null,"github_token":null,"enable_default_condenser":true}' > ~/.openhands-state/settings.json

docker run -it --rm --pull=always \
    -e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.39-nikolaik \
    -e LOG_ALL_EVENTS=true \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v ~/.openhands-state:/.openhands-state \
    -p 3000:3000 \
    --add-host host.docker.internal:host-gateway \
    --name openhands-app \
    docker.all-hands.dev/all-hands-ai/openhands:0.39

本地推理方式：
- 可以使用LMStudio或其他庫進行本地部署，具體支持的庫如下：

OpenHands使用（推薦）

啟動服務器部署Devstral-Small-2505

確保您已按照上述說明啟動了兼容OpenAI的服務器（如vLLM或Ollama），然後可以使用OpenHands與Devstral-Small-2505進行交互。在本教程中，我們通過以下命令啟動vLLM服務器：

vllm serve mistralai/Devstral-Small-2505 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

服務器地址應採用以下格式：http://<your-server-url>:8000/v1

啟動OpenHands

您可以按照此處的說明安裝OpenHands。啟動OpenHands最簡單的方法是使用Docker鏡像：

docker pull docker.all-hands.dev/all-hands-ai/runtime:0.38-nikolaik

docker run -it --rm --pull=always \
    -e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.38-nikolaik \
    -e LOG_ALL_EVENTS=true \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v ~/.openhands-state:/.openhands-state \
    -p 3000:3000 \
    --add-host host.docker.internal:host-gateway \
    --name openhands-app \
    docker.all-hands.dev/all-hands-ai/openhands:0.38

然後，您可以通過http://localhost:3000訪問OpenHands的用戶界面。

連接到服務器

訪問OpenHands用戶界面時，系統會提示您連接到服務器。您可以使用高級模式連接到之前啟動的服務器。填寫以下字段：

自定義模型：openai/mistralai/Devstral-Small-2505
基礎URL：http://<your-server-url>:8000/v1
API密鑰：token（如果在啟動服務器時使用了其他令牌，請填寫相應的令牌）

使用由Devstral驅動的OpenHands

現在，您可以通過開始新對話在OpenHands中使用Devstral Small。讓我們來構建一個待辦事項列表應用程序。

待辦事項列表應用程序

讓我們使用以下提示讓Devstral生成應用程序：

構建一個待辦事項列表應用程序，滿足以下要求：
- 使用FastAPI和React構建。
- 使其成為單頁應用程序，具備以下功能：
  - 允許添加任務。
  - 允許刪除任務。
  - 允許將任務標記為已完成。
  - 顯示任務列表。
- 將任務存儲在SQLite數據庫中。

智能體提示

查看結果您應該會看到智能體構建應用程序，並能夠查看它生成的代碼。如果它沒有自動完成部署，您可以要求Devstral部署應用程序，或者手動進行部署，然後訪問前端部署URL查看應用程序。
迭代優化現在您已經得到了第一個結果，可以通過要求智能體進行改進來進行迭代。例如，在生成的應用程序中，我們可以點擊任務將其標記為已選中，但添加一個複選框將改善用戶體驗。您還可以要求它添加編輯任務的功能，或者添加按狀態過濾任務的功能。

享受使用Devstral Small和OpenHands進行開發的樂趣！

✨ 主要特性

智能編碼：專為智能編碼任務設計，是軟件工程智能體的理想選擇。
輕量級：僅具有240億參數，體積小巧，可在單個RTX 4090或配備32GB RAM的Mac上運行，適合本地部署和設備端使用。
Apache 2.0許可證：開放許可證，允許商業和非商業用途的使用和修改。
上下文窗口：擁有128k的上下文窗口。
分詞器：使用Tekken分詞器，詞彙量為131k。

📚 詳細文檔

基準測試結果

SWE-Bench

Devstral在SWE-Bench Verified測試中獲得了46.8%的分數，比之前的開源最優模型高出6%。

模型	腳手架	SWE-Bench Verified (%)
Devstral	OpenHands Scaffold	46.8
GPT-4.1-mini	OpenAI Scaffold	23.6
Claude 3.5 Haiku	Anthropic Scaffold	40.6
SWE-smith-LM 32B	SWE-agent Scaffold	40.2

在相同的測試腳手架（由All Hands AI提供的OpenHands🙌）下進行評估時，Devstral的表現遠超Deepseek-V3-0324和Qwen3 232B-A22B等更大的模型。

SWE基準測試

不同庫的使用說明

LMStudio（推薦用於量化模型）

從Hugging Face下載權重：

pip install -U "huggingface_hub[cli]"
huggingface-cli download \
"mistralai/Devstral-Small-2505_gguf" \
--include "devstralQ4_K_M.gguf" \
--local-dir "mistralai/Devstral-Small-2505_gguf/"

您可以使用LMStudio在本地提供模型服務：

下載並安裝LM Studio。
安裝lms cli ~/.lmstudio/bin/lms bootstrap。
在bash終端中，在下載模型檢查點的目錄（例如mistralai/Devstral-Small-2505_gguf）中運行lms import devstralQ4_K_M.ggu。
打開LMStudio應用程序，點擊終端圖標進入開發者選項卡。點擊“選擇要加載的模型”並選擇Devstral Q4 K M。切換狀態按鈕以啟動模型，在設置中切換“在本地網絡上提供服務”為開啟狀態。
在右側選項卡中，您將看到一個API標識符（應為devstralq4_k_m）和一個API地址。請記錄此地址，我們將在下一步中使用。

啟動Openhands：

docker pull docker.all-hands.dev/all-hands-ai/runtime:0.38-nikolaik
docker run -it --rm --pull=always \
    -e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.38-nikolaik \
    -e LOG_ALL_EVENTS=true \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v ~/.openhands-state:/.openhands-state \
    -p 3000:3000 \
    --add-host host.docker.internal:host-gateway \
    --name openhands-app \
    docker.all-hands.dev/all-hands-ai/openhands:0.38

點擊第二行的“查看高級設置”。在新選項卡中，將“高級”切換為開啟狀態。將自定義模型設置為mistral/devstralq4_k_m，將基礎URL設置為我們在LM Studio中獲得的API地址。將API密鑰設置為dummy。點擊“保存更改”。

vLLM（推薦）

我們建議使用vLLM庫來實現生產就緒的推理管道。安裝確保您安裝了vLLM >= 0.8.5：

pip install vllm --upgrade

這樣做應該會自動安裝mistral_common >= 1.5.5。檢查安裝情況：

python -c "import mistral_common; print(mistral_common.__version__)"

您還可以使用現成的Docker鏡像或在Docker Hub上獲取。

服務器部署

我們建議在服務器/客戶端環境中使用Devstral。

啟動服務器：

vllm serve mistralai/Devstral-Small-2505 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

您可以使用以下簡單的Python代碼片段來測試客戶端：

import requests
import json
from huggingface_hub import hf_hub_download

url = "http://<your-server-url>:8000/v1/chat/completions"
headers = {"Content-Type": "application/json", "Authorization": "Bearer token"}

model = "mistralai/Devstral-Small-2505"

def load_system_prompt(repo_id: str, filename: str) -> str:
    file_path = hf_hub_download(repo_id=repo_id, filename=filename)
    with open(file_path, "r") as file:
        system_prompt = file.read()
    return system_prompt

SYSTEM_PROMPT = load_system_prompt(model, "SYSTEM_PROMPT.txt")

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {
        "role": "user",
        "content": [
            {
                "type": "text",
                "text": "<your-command>",
            },
        ],
    },
]

data = {"model": model, "messages": messages, "temperature": 0.15}

response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json()["choices"][0]["message"]["content"])

Mistral-inference

我們建議使用mistral-inference快速試用Devstral。

安裝

確保安裝了mistral_inference >= 1.6.0：

pip install mistral_inference --upgrade

下載

from huggingface_hub import snapshot_download
from pathlib import Path

mistral_models_path = Path.home().joinpath('mistral_models', 'Devstral')
mistral_models_path.mkdir(parents=True, exist_ok=True)

snapshot_download(repo_id="mistralai/Devstral-Small-2505", allow_patterns=["params.json", "consolidated.safetensors", "tekken.json"], local_dir=mistral_models_path)

運行

您可以使用以下命令運行模型：

mistral-chat $HOME/mistral_models/Devstral --instruct --max_tokens 300

然後，您可以輸入任何提示進行交互。

Ollama

您可以使用Ollama命令行界面運行Devstral：

ollama run devstral

Transformers

為了在transformers中充分利用我們的模型，請確保安裝了mistral-common >= 1.5.5以使用我們的分詞器：

pip install mistral-common --upgrade

然後加載我們的分詞器和模型並進行生成：

import torch

from mistral_common.protocol.instruct.messages import (
    SystemMessage, UserMessage
)
from mistral_common.protocol.instruct.request import ChatCompletionRequest
from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from mistral_common.tokens.tokenizers.tekken import SpecialTokenPolicy
from huggingface_hub import hf_hub_download
from transformers import AutoModelForCausalLM

def load_system_prompt(repo_id: str, filename: str) -> str:
    file_path = hf_hub_download(repo_id=repo_id, filename=filename)
    with open(file_path, "r") as file:
        system_prompt = file.read()
    return system_prompt

model_id = "mistralai/Devstral-Small-2505"
tekken_file = hf_hub_download(repo_id=model_id, filename="tekken.json")
SYSTEM_PROMPT = load_system_prompt(model_id, "SYSTEM_PROMPT.txt")

tokenizer = MistralTokenizer.from_file(tekken_file)

model = AutoModelForCausalLM.from_pretrained(model_id)

tokenized = tokenizer.encode_chat_completion(
    ChatCompletionRequest(
        messages=[
            SystemMessage(content=SYSTEM_PROMPT),
            UserMessage(content="<your-command>"),
        ],
    )
)

output = model.generate(
    input_ids=torch.tensor([tokenized.tokens]),
    max_new_tokens=1000,
)[0]

decoded_output = tokenizer.decode(output[len(tokenized.tokens):])
print(decoded_output)