DeepSWE-Preview-GGUF开源文本生成模型 - 支持长上下文解决软件工程任务

首页

Deepswe Preview GGUF

由 lmstudio-community 开发

基于Transformer架构的文本生成模型，专注于软件工程任务，支持40k token的上下文长度。

大型语言模型英语开源协议:MIT #软件工程RL优化 #40k长上下文 #代码生成SOTA

下载量 356

发布时间 : 7/3/2025

模型简介

这是一个高效的文本生成模型，特别优化用于软件工程任务，采用强化学习训练，在SWE-Bench-Verified测试中表现优异。

模型特点

超长上下文支持

支持40k token的上下文长度，适合处理复杂任务。

强化学习训练

仅通过强化学习训练的编码代理，在软件工程任务中表现卓越。

高性能表现

在SWE-Bench-Verified测试中取得59.0%的成绩，开放权重类别中排名第一。

基于Qwen3-32B

在启用思考模式的Qwen3-32B基础上进行训练，继承了其优秀特性。

模型能力

文本生成

代码生成

软件工程任务处理

长文本理解

使用案例

软件开发

代码自动补全

帮助开发者快速生成代码片段

提高开发效率

Bug修复

分析并修复软件中的错误

在SWE-Bench测试中表现优异

技术文档

文档生成

自动生成技术文档

节省文档编写时间

🚀 Agentica-Org的DeepSWE Preview社区模型

本模型是基于Transformer架构的文本生成模型，可实现高效的文本生成，在软件工程任务方面表现出色。

🚀 快速开始

该模型是 LM Studio 社区模型亮点计划的一部分。此计划旨在展示社区中新颖且值得关注的模型。欢迎加入 Discord 参与讨论。

模型创建者：agentica-org 原始模型：DeepSWE-Preview GGUF量化：由 bartowski 基于 llama.cpp 版本 b5760 提供

✨ 主要特性

支持40k token的上下文长度。
在启用思考模式的Qwen3 - 32B基础上进行训练。
仅使用强化学习（RL）训练的编码代理，在软件工程（SWE）任务中表现卓越。
在SWE - Bench - Verified上取得了令人瞩目的59.0%的成绩，目前在开放权重类别中排名第一。

🔧 技术细节

该模型支持40k token的上下文长度，在启用思考模式的Qwen3 - 32B基础上进行训练。它是一个仅通过强化学习（RL）训练的编码代理，专门用于在软件工程（SWE）任务中表现出色。在SWE - Bench - Verified测试中，该模型取得了59.0%的优异成绩，目前在开放权重类别中排名第一。更多详细信息可查看其技术博客文章。

📄 许可证

本模型采用MIT许可证。

📋 模型信息

属性	详情
量化者	bartowski
任务类型	文本生成
基础模型	agentica-org/DeepSWE-Preview
基础模型关系	量化
许可证	MIT
语言	英语
训练数据集	R2E-Gym/R2E-Gym-Subset

🙏 特别感谢

特别感谢 Georgi Gerganov 以及 llama.cpp 团队，是他们让这一切成为可能。

⚠️ 免责声明

LM Studio并非社区模型计划中任何模型的创建者、发起者或所有者。每个社区模型均由第三方创建和提供。LM Studio不认可、支持、代表或保证任何社区模型的完整性、真实性、准确性或可靠性。您需明白，社区模型生成的内容可能具有冒犯性、有害性、不准确性或其他不当之处，甚至具有欺骗性。每个社区模型的唯一责任方是发起该模型的个人或实体。LM Studio可能不会监控或控制社区模型，并且不能也不会对任何此类模型负责。LM Studio免除所有关于社区模型准确性、可靠性或益处的保证。此外，LM Studio进一步免除任何关于社区模型将满足您的要求、安全、不间断或在任何时间或地点可用、无错误、无病毒或任何错误将得到纠正等方面的保证。您将独自承担因使用或访问社区模型、下载任何社区模型或使用由LM Studio提供或通过LM Studio提供的任何其他社区模型而导致的任何损害。