Devstral-Small-2507開源模型 - 助力軟件工程，探索代碼庫與編輯文件更輕鬆

Home

Devstral Small 2507

Developed by mistralai

Devstral是一款專為軟件工程任務打造的智能大語言模型，由Mistral AI和All Hands AI合作開發。它擅長利用工具探索代碼庫、編輯多個文件，併為軟件工程智能體提供強大支持。

大型語言模型

Safetensors

Supports Multiple LanguagesOpen Source License:Apache-2.0 #智能編碼助手 #軟件工程優化 #128k長上下文

Downloads 7,325

Release Time : 7/4/2025

Model Overview

Devstral是一款基於Mistral-Small-3.1微調的智能大語言模型，專注於軟件工程任務，具有128k token的長上下文窗口和240億參數的緊湊規模。

Model Features

智能編碼

專為智能編碼任務設計，是軟件工程智能體的理想選擇。

輕量級

240億參數的緊湊規模，適合本地部署和設備端使用。

長上下文窗口

支持128k token的上下文窗口，適合處理長代碼文件。

工具調用支持

支持Mistral的函數調用格式，能夠與工具鏈無縫集成。

Model Capabilities

代碼生成

代碼編輯

代碼庫探索

測試覆蓋率分析

軟件工程任務自動化

Use Cases

軟件開發

測試覆蓋率分析

分析代碼庫的測試覆蓋率並生成可視化圖表。

生成覆蓋率分佈圖、餅圖和摘要圖。

視頻遊戲開發

創建混合《太空侵略者》和《乒乓》的網頁視頻遊戲。

實現雙玩家控制、侵略者射擊和計分系統。

🚀 Devstral Small 1.1

Devstral是一款專為軟件工程任務打造的智能大語言模型（LLM），由Mistral AI和All Hands AI合作開發👏。它擅長利用工具探索代碼庫、編輯多個文件，併為軟件工程智能體提供強大支持。該模型在SWE-bench基準測試中表現卓越，榮登此基準測試開源模型榜首。

它基於Mistral-Small-3.1進行微調，因此擁有高達128k token的長上下文窗口。作為一個純文本的編碼智能體，在從Mistral-Small-3.1微調之前，其視覺編碼器已被移除。

對於需要特殊功能（如增加上下文、特定領域知識等）的企業，我們將發佈比Mistral AI社區貢獻版本更強大的商業模型。

在我們的博客文章中瞭解更多關於Devstral的信息。

與Devstral Small 1.0相比的更新內容：

性能提升，請參考基準測試結果。
Devstral Small 1.1與OpenHands搭配使用時依然出色。這個新版本在其他提示和編碼環境中的泛化能力也更好。
支持Mistral的函數調用格式。

🚀 快速開始

Devstral是一款強大的軟件工程智能大語言模型，以下為你介紹其使用的相關信息，幫助你快速上手。

✨ 主要特性

智能編碼：Devstral專為智能編碼任務而設計，是軟件工程智能體的理想選擇。
輕量級：僅240億參數的緊湊規模，使得Devstral能夠在單張RTX 4090或擁有32GB內存的Mac上運行，適合本地部署和設備端使用。
Apache 2.0許可證：開放許可，允許商業和非商業用途的使用和修改。
上下文窗口：擁有128k的上下文窗口。
分詞器：採用詞彙量為131k的Tekken分詞器。

📦 安裝指南

API

按照以下說明創建Mistral賬戶並獲取API密鑰。

然後運行以下命令啟動OpenHands Docker容器。

export MISTRAL_API_KEY=<MY_KEY>

mkdir -p ~/.openhands && echo '{"language":"en","agent":"CodeActAgent","max_iterations":null,"security_analyzer":null,"confirmation_mode":false,"llm_model":"mistral/devstral-small-2507","llm_api_key":"'$MISTRAL_API_KEY'","remote_runtime_resource_factor":null,"github_token":null,"enable_default_condenser":true}' > ~/.openhands-state/settings.json

docker pull docker.all-hands.dev/all-hands-ai/runtime:0.48-nikolaik

docker run -it --rm --pull=always \
    -e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.48-nikolaik \
    -e LOG_ALL_EVENTS=true \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v ~/.openhands:/.openhands \
    -p 3000:3000 \
    --add-host host.docker.internal:host-gateway \
    --name openhands-app \
    docker.all-hands.dev/all-hands-ai/openhands:0.48

本地推理

該模型也可以使用以下庫進行部署：

vllm (推薦)：詳情見此處
mistral-inference：詳情見此處
transformers：詳情見此處
LMStudio：詳情見此處
llama.cpp：詳情見此處
ollama：詳情見此處

vLLM (推薦)

展開

我們建議使用vLLM庫來實現生產就緒的推理管道。

安裝

確保你安裝了vLLM >= 0.9.1：

pip install vllm --upgrade

同時確保安裝了mistral_common >= 1.7.0。

pip install mistral-common --upgrade

要進行檢查：

python -c "import mistral_common; print(mistral_common.__version__)"

你也可以使用現成的Docker鏡像或在Docker Hub上獲取。

啟動服務器

我們建議在服務器/客戶端環境中使用Devstral。

啟動服務器：

vllm serve mistralai/Devstral-Small-2507 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

要測試客戶端，你可以使用一個簡單的Python代碼片段。

import requests
import json
from huggingface_hub import hf_hub_download


url = "http://<your-server-url>:8000/v1/chat/completions"
headers = {"Content-Type": "application/json", "Authorization": "Bearer token"}

model = "mistralai/Devstral-Small-2507"

def load_system_prompt(repo_id: str, filename: str) -> str:
    file_path = hf_hub_download(repo_id=repo_id, filename=filename)
    with open(file_path, "r") as file:
        system_prompt = file.read()
    return system_prompt

SYSTEM_PROMPT = load_system_prompt(model, "SYSTEM_PROMPT.txt")

messages = [
    {"role": "system", "content": SYSTEM_PROMPT},
    {
        "role": "user",
        "content": [
            {
                "type": "text",
                "text": "<your-command>",
            },
        ],
    },
]

data = {"model": model, "messages": messages, "temperature": 0.15}

# Devstral Small 1.1支持工具調用。如果你想使用工具，請按以下操作：
# tools = [ # 為vLLM定義工具
#     {
#         "type": "function",
#         "function": {
#             "name": "git_clone",
#             "description": "克隆一個git倉庫",
#             "parameters": {
#                 "type": "object",
#                 "properties": {
#                     "url": {
#                         "type": "string",
#                         "description": "git倉庫的URL",
#                     },
#                 },
#                 "required": ["url"],
#             },
#         },
#     }
# ] 
# data = {"model": model, "messages": messages, "temperature": 0.15, "tools": tools} # 將工具傳遞給負載。

response = requests.post(url, headers=headers, data=json.dumps(data))
print(response.json()["choices"][0]["message"]["content"])

Mistral-inference

展開

我們建議使用mistral-inference來快速試用Devstral。

安裝

確保安裝了mistral_inference >= 1.6.0。

pip install mistral_inference --upgrade

下載

from huggingface_hub import snapshot_download
from pathlib import Path

mistral_models_path = Path.home().joinpath('mistral_models', 'Devstral')
mistral_models_path.mkdir(parents=True, exist_ok=True)

snapshot_download(repo_id="mistralai/Devstral-Small-2507", allow_patterns=["params.json", "consolidated.safetensors", "tekken.json"], local_dir=mistral_models_path)

聊天

你可以使用以下命令運行模型：

mistral-chat $HOME/mistral_models/Devstral --instruct --max_tokens 300

然後你可以輸入任何你想要的提示。

Transformers

展開

要充分利用transformers使用我們的模型，請確保已安裝 mistral-common >= 1.7.0以使用我們的分詞器。

pip install mistral-common --upgrade

然後加載我們的分詞器和模型並進行生成：

import torch

from mistral_common.protocol.instruct.messages import (
    SystemMessage, UserMessage
)
from mistral_common.protocol.instruct.request import ChatCompletionRequest
from mistral_common.tokens.tokenizers.mistral import MistralTokenizer
from huggingface_hub import hf_hub_download
from transformers import AutoModelForCausalLM

def load_system_prompt(repo_id: str, filename: str) -> str:
    file_path = hf_hub_download(repo_id=repo_id, filename=filename)
    with open(file_path, "r") as file:
        system_prompt = file.read()
    return system_prompt

model_id = "mistralai/Devstral-Small-2507"
SYSTEM_PROMPT = load_system_prompt(model_id, "SYSTEM_PROMPT.txt")


tokenizer = MistralTokenizer.from_hf_hub(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id)

tokenized = tokenizer.encode_chat_completion(
    ChatCompletionRequest(
        messages=[
            SystemMessage(content=SYSTEM_PROMPT),
            UserMessage(content="<your-command>"),
        ],
    )
)

output = model.generate(
    input_ids=torch.tensor([tokenized.tokens]),
    max_new_tokens=1000,
)[0]

decoded_output = tokenizer.decode(output[len(tokenized.tokens):])
print(decoded_output)

LM Studio

展開

從以下任意一處下載權重：

LM Studio GGUF倉庫（推薦）：https://huggingface.co/lmstudio-community/Devstral-Small-2507-GGUF
我們的GGUF倉庫：https://huggingface.co/mistralai/Devstral-Small-2507_gguf

pip install -U "huggingface_hub[cli]"
huggingface-cli download \
"lmstudio-community/Devstral-Small-2507-GGUF" \ # 或 mistralai/Devstral-Small-2507_gguf
--include "Devstral-Small-2507-Q4_K_M.gguf" \
--local-dir "Devstral-Small-2507_gguf/"

你可以使用LMStudio在本地部署模型。

下載LM Studio並進行安裝
安裝lms cli ~/.lmstudio/bin/lms bootstrap
在bash終端中，在下載模型檢查點的目錄（例如Devstral-Small-2507_gguf）下運行lms import Devstral-Small-2507-Q4_K_M.gguf
打開LM Studio應用程序，點擊終端圖標進入開發者選項卡。點擊選擇要加載的模型並選擇Devstral Small 2507。切換狀態按鈕以啟動模型，在設置中切換“在本地網絡上服務”為開啟狀態。
在右側選項卡中，你將看到一個API標識符，應該是devstral-small-2507，以及API使用下的API地址。記錄此地址，它將用於OpenHands或Cline。

llama.cpp

展開

從Hugging Face下載權重：

pip install -U "huggingface_hub[cli]"
huggingface-cli download \
"mistralai/Devstral-Small-2507_gguf" \
--include "Devstral-Small-2507-Q4_K_M.gguf" \
--local-dir "mistralai/Devstral-Small-2507_gguf/"

然後使用llama.cpp服務器運行Devstral。

./llama-server -m mistralai/Devstral-Small-2507_gguf/Devstral-Small-2507-Q4_K_M.gguf -c 0 # -c配置上下文大小，0表示模型的默認值，這裡是128k。

OpenHands (推薦)

啟動服務器以部署Devstral Small 1.1

確保你已按照上述說明啟動了兼容OpenAI的服務器，如vLLM或Ollama。然後，你可以使用OpenHands與Devstral Small 1.1進行交互。

在本教程中，我們通過運行以下命令啟動了一個vLLM服務器：

vllm serve mistralai/Devstral-Small-2507 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

服務器地址應採用以下格式：http://<your-server-url>:8000/v1

啟動OpenHands

你可以按照此處的說明安裝OpenHands。

啟動OpenHands最簡單的方法是使用Docker鏡像：

docker pull docker.all-hands.dev/all-hands-ai/runtime:0.48-nikolaik

docker run -it --rm --pull=always \
    -e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.48-nikolaik \
    -e LOG_ALL_EVENTS=true \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -v ~/.openhands:/.openhands \
    -p 3000:3000 \
    --add-host host.docker.internal:host-gateway \
    --name openhands-app \
    docker.all-hands.dev/all-hands-ai/openhands:0.48

然後，你可以在http://localhost:3000訪問OpenHands用戶界面。

連接到服務器

當訪問OpenHands用戶界面時，系統會提示你連接到服務器。你可以使用高級模式連接到之前啟動的服務器。

填寫以下字段：

自定義模型：openai/mistralai/Devstral-Small-2507
基礎URL：http://<your-server-url>:8000/v1
API密鑰：token（或者如果你在啟動服務器時使用了其他令牌，則填寫該令牌）

查看設置

OpenHands Settings

Cline

啟動服務器以部署Devstral Small 1.1

確保你已按照上述說明啟動了兼容OpenAI的服務器，如vLLM或Ollama。然後，你可以使用OpenHands與Devstral Small 1.1進行交互。

在本教程中，我們通過運行以下命令啟動了一個vLLM服務器：

vllm serve mistralai/Devstral-Small-2507 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

服務器地址應採用以下格式：http://<your-server-url>:8000/v1

啟動Cline

你可以按照此處的說明安裝Cline。然後你可以在設置中配置服務器地址。

查看設置

Cline Settings

💻 使用示例

OpenHands：瞭解Mistral Common的測試覆蓋率

我們可以啟動OpenHands腳手架並將其鏈接到一個倉庫，以分析測試覆蓋率並識別覆蓋率較低的文件。這裡我們從我們的公共mistral-common倉庫開始。

在倉庫掛載到工作區後，我們給出以下指令

檢查倉庫的測試覆蓋率，然後創建測試覆蓋率的可視化圖表。嘗試繪製幾種不同類型的圖表並將它們保存為png文件。

智能體將首先瀏覽代碼庫以檢查測試配置和結構。

mistral common coverage - prompt

然後它會設置測試依賴項並啟動覆蓋率測試：

mistral common coverage - dependencies

最後，智能體編寫必要的代碼來可視化覆蓋率，導出結果並將圖表保存為png文件。 mistral common coverage - visualization

運行結束時，會生成以下圖表： mistral common coverage - coverage distribution

並且模型能夠解釋結果： mistral common coverage - navigate

Cline：構建一個視頻遊戲

首先在VSCode中初始化Cline並將其連接到之前啟動的服務器。

我們給出以下指令來構建視頻遊戲：

創建一個將《太空侵略者》和《乒乓》混合的網頁視頻遊戲。

遵循以下說明：
- 有兩名玩家，一名在頂部，一名在底部。玩家通過控制一個橫杆來反彈球。
- 第一名玩家使用“a”和“d”鍵進行控制，第二名玩家使用左右箭頭鍵。
- 侵略者位於屏幕中央。它們看起來應該像《太空侵略者》中的侵略者。它們的目標是隨機向玩家射擊。它們不會被穿過它們的球摧毀。這意味著侵略者永遠不會死亡。
- 玩家的目標是躲避太空侵略者的射擊，並將球擊向對方玩家的邊緣。
- 球在左右邊緣反彈。
- 一旦球觸及其中一名玩家的邊緣，該玩家失敗。
- 一旦一名玩家被射擊擊中3次或更多次，該玩家失敗。
- 最後倖存的玩家獲勝。
- 在用戶界面上顯示玩家擊球的次數和剩餘生命值。

space invaders pong - prompt

智能體將首先創建遊戲：

space invaders pong - structure

然後它會解釋如何啟動遊戲：

space invaders pong - task completed

最後，遊戲可以開始玩了：

space invaders pong - game

不要猶豫對Devstral進行迭代或提供更多信息以改進遊戲！

📚 詳細文檔

基準測試結果

SWE-Bench

Devstral Small 1.1在SWE-Bench Verified測試中取得了**53.6%**的分數，比Devstral Small 1.0高出6.8%，比第二好的現有模型高出11.4%。

模型	智能體腳手架	SWE-Bench Verified (%)
Devstral Small 1.1	OpenHands Scaffold	53.6
Devstral Small 1.0	OpenHands Scaffold	46.8
GPT-4.1-mini	OpenAI Scaffold	23.6
Claude 3.5 Haiku	Anthropic Scaffold	40.6
SWE-smith-LM 32B	SWE-agent Scaffold	40.2
Skywork SWE	OpenHands Scaffold	38.0
DeepSWE	R2E-Gym Scaffold	42.2