D

Deepswe Preview GGUF

由 lmstudio-community 开发
基于Transformer架构的文本生成模型,专注于软件工程任务,支持40k token的上下文长度。
下载量 356
发布时间 : 7/3/2025

模型简介

这是一个高效的文本生成模型,特别优化用于软件工程任务,采用强化学习训练,在SWE-Bench-Verified测试中表现优异。

模型特点

超长上下文支持
支持40k token的上下文长度,适合处理复杂任务。
强化学习训练
仅通过强化学习训练的编码代理,在软件工程任务中表现卓越。
高性能表现
在SWE-Bench-Verified测试中取得59.0%的成绩,开放权重类别中排名第一。
基于Qwen3-32B
在启用思考模式的Qwen3-32B基础上进行训练,继承了其优秀特性。

模型能力

文本生成
代码生成
软件工程任务处理
长文本理解

使用案例

软件开发
代码自动补全
帮助开发者快速生成代码片段
提高开发效率
Bug修复
分析并修复软件中的错误
在SWE-Bench测试中表现优异
技术文档
文档生成
自动生成技术文档
节省文档编写时间
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase