D

Deepswe Preview GGUF

Developed by lmstudio-community
基于Transformer架构的文本生成模型,专注于软件工程任务,支持40k token的上下文长度。
Downloads 356
Release Time : 7/3/2025

Model Overview

这是一个高效的文本生成模型,特别优化用于软件工程任务,采用强化学习训练,在SWE-Bench-Verified测试中表现优异。

Model Features

超长上下文支持
支持40k token的上下文长度,适合处理复杂任务。
强化学习训练
仅通过强化学习训练的编码代理,在软件工程任务中表现卓越。
高性能表现
在SWE-Bench-Verified测试中取得59.0%的成绩,开放权重类别中排名第一。
基于Qwen3-32B
在启用思考模式的Qwen3-32B基础上进行训练,继承了其优秀特性。

Model Capabilities

文本生成
代码生成
软件工程任务处理
长文本理解

Use Cases

软件开发
代码自动补全
帮助开发者快速生成代码片段
提高开发效率
Bug修复
分析并修复软件中的错误
在SWE-Bench测试中表现优异
技术文档
文档生成
自动生成技术文档
节省文档编写时间
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase