D

Deepswe Preview GGUF

由lmstudio-community開發
基於Transformer架構的文本生成模型,專注於軟件工程任務,支持40k token的上下文長度。
下載量 356
發布時間 : 7/3/2025

模型概述

這是一個高效的文本生成模型,特別優化用於軟件工程任務,採用強化學習訓練,在SWE-Bench-Verified測試中表現優異。

模型特點

超長上下文支持
支持40k token的上下文長度,適合處理複雜任務。
強化學習訓練
僅通過強化學習訓練的編碼代理,在軟件工程任務中表現卓越。
高性能表現
在SWE-Bench-Verified測試中取得59.0%的成績,開放權重類別中排名第一。
基於Qwen3-32B
在啟用思考模式的Qwen3-32B基礎上進行訓練,繼承了其優秀特性。

模型能力

文本生成
代碼生成
軟件工程任務處理
長文本理解

使用案例

軟件開發
代碼自動補全
幫助開發者快速生成代碼片段
提高開發效率
Bug修復
分析並修復軟件中的錯誤
在SWE-Bench測試中表現優異
技術文檔
文檔生成
自動生成技術文檔
節省文檔編寫時間
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase