DeepSWE-Preview-GGUF開源文本生成模型 - 支持長上下文解決軟件工程任務

首頁

Deepswe Preview GGUF

由lmstudio-community開發

基於Transformer架構的文本生成模型，專注於軟件工程任務，支持40k token的上下文長度。

大型語言模型英語開源協議:MIT #軟件工程RL優化 #40k長上下文 #代碼生成SOTA

下載量 356

發布時間 : 7/3/2025

模型概述

這是一個高效的文本生成模型，特別優化用於軟件工程任務，採用強化學習訓練，在SWE-Bench-Verified測試中表現優異。

模型特點

超長上下文支持

支持40k token的上下文長度，適合處理複雜任務。

強化學習訓練

僅通過強化學習訓練的編碼代理，在軟件工程任務中表現卓越。

高性能表現

在SWE-Bench-Verified測試中取得59.0%的成績，開放權重類別中排名第一。

基於Qwen3-32B

在啟用思考模式的Qwen3-32B基礎上進行訓練，繼承了其優秀特性。

模型能力

文本生成

代碼生成

軟件工程任務處理

長文本理解

使用案例

軟件開發

代碼自動補全

幫助開發者快速生成代碼片段

提高開發效率

Bug修復

分析並修復軟件中的錯誤

在SWE-Bench測試中表現優異

技術文檔

文檔生成

自動生成技術文檔

節省文檔編寫時間

🚀 Agentica-Org的DeepSWE Preview社區模型

本模型是基於Transformer架構的文本生成模型，可實現高效的文本生成，在軟件工程任務方面表現出色。

🚀 快速開始

該模型是 LM Studio 社區模型亮點計劃的一部分。此計劃旨在展示社區中新穎且值得關注的模型。歡迎加入 Discord 參與討論。

模型創建者：agentica-org 原始模型：DeepSWE-Preview GGUF量化：由 bartowski 基於 llama.cpp 版本 b5760 提供

✨ 主要特性

支持40k token的上下文長度。
在啟用思考模式的Qwen3 - 32B基礎上進行訓練。
僅使用強化學習（RL）訓練的編碼代理，在軟件工程（SWE）任務中表現卓越。
在SWE - Bench - Verified上取得了令人矚目的59.0%的成績，目前在開放權重類別中排名第一。

🔧 技術細節

該模型支持40k token的上下文長度，在啟用思考模式的Qwen3 - 32B基礎上進行訓練。它是一個僅通過強化學習（RL）訓練的編碼代理，專門用於在軟件工程（SWE）任務中表現出色。在SWE - Bench - Verified測試中，該模型取得了59.0%的優異成績，目前在開放權重類別中排名第一。更多詳細信息可查看其技術博客文章。

📄 許可證

本模型採用MIT許可證。

📋 模型信息

屬性	詳情
量化者	bartowski
任務類型	文本生成
基礎模型	agentica-org/DeepSWE-Preview
基礎模型關係	量化
許可證	MIT
語言	英語
訓練數據集	R2E-Gym/R2E-Gym-Subset

🙏 特別感謝

特別感謝 Georgi Gerganov 以及 llama.cpp 團隊，是他們讓這一切成為可能。

⚠️ 免責聲明

LM Studio並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您需明白，社區模型生成的內容可能具有冒犯性、有害性、不準確性或其他不當之處，甚至具有欺騙性。每個社區模型的唯一責任方是發起該模型的個人或實體。LM Studio可能不會監控或控制社區模型，並且不能也不會對任何此類模型負責。LM Studio免除所有關於社區模型準確性、可靠性或益處的保證。此外，LM Studio進一步免除任何關於社區模型將滿足您的要求、安全、不間斷或在任何時間或地點可用、無錯誤、無病毒或任何錯誤將得到糾正等方面的保證。您將獨自承擔因使用或訪問社區模型、下載任何社區模型或使用由LM Studio提供或通過LM Studio提供的任何其他社區模型而導致的任何損害。