D

Deepcoder 1.5B Preview GGUF

由Mungert開發
基於DeepSeek-R1-Distilled-Qwen-1.5B微調的代碼推理大語言模型,採用分佈式強化學習技術擴展長上下文處理能力
下載量 888
發布時間 : 4/15/2025

模型概述

DeepCoder是一個專注於代碼推理的大語言模型,通過強化學習技術優化了長上下文處理能力,適用於編程輔助和代碼生成任務

模型特點

強化學習優化
採用改進版GRPO(GRPO+)和DeepScaleR提出的迭代上下文延長技術進行訓練
長上下文處理
通過迭代上下文延長技術,模型能有效處理長達64K的上下文
代碼推理能力
專注於編程問題的解決和代碼生成,在多個編程基準測試中表現優異

模型能力

代碼生成
編程問題解決
長上下文處理
文本生成

使用案例

編程輔助
算法問題解決
幫助解決Codeforces等平臺上的算法問題
在Codeforces上達到963分(28.5百分位)
代碼補全
為開發者提供代碼補全建議
在HumanEval+上達到73.0分
教育
編程學習輔助
幫助學生理解和解決編程練習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase