D

Deepcoder 1.5B Preview Exl2 4.65bpw

由async0x42開發
基於DeepSeek-R1-Distilled-Qwen-1.5B微調的代碼推理大模型,採用分佈式強化學習技術擴展長上下文處理能力
下載量 14
發布時間 : 4/9/2025

模型概述

DeepCoder是一個專注於代碼生成和推理的大語言模型,通過強化學習技術優化了長上下文處理能力,適用於編程輔助和代碼生成任務。

模型特點

強化學習優化
採用改進版GRPO算法(GRPO+)與迭代式上下文擴展技術,提升訓練穩定性
長上下文處理
支持64K上下文長度,在長代碼生成任務中表現優異
高性能代碼生成
在LiveCodeBench、Codeforces等編程基準測試中表現優於基礎模型

模型能力

代碼生成
編程問題解答
代碼補全
算法實現

使用案例

編程輔助
競賽編程
解決Codeforces等編程競賽題目
Codeforces評分963,百分位28.5%
面試準備
生成HumanEval+等編程面試題的解決方案
HumanEval+得分73.0
教育
編程學習
為學習者提供代碼示例和解釋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase