D

Deepcoder 1.5B Preview Exl2 4.65bpw

由 async0x42 开发
基于DeepSeek-R1-Distilled-Qwen-1.5B微调的代码推理大模型,采用分布式强化学习技术扩展长上下文处理能力
下载量 14
发布时间 : 4/9/2025

模型简介

DeepCoder是一个专注于代码生成和推理的大语言模型,通过强化学习技术优化了长上下文处理能力,适用于编程辅助和代码生成任务。

模型特点

强化学习优化
采用改进版GRPO算法(GRPO+)与迭代式上下文扩展技术,提升训练稳定性
长上下文处理
支持64K上下文长度,在长代码生成任务中表现优异
高性能代码生成
在LiveCodeBench、Codeforces等编程基准测试中表现优于基础模型

模型能力

代码生成
编程问题解答
代码补全
算法实现

使用案例

编程辅助
竞赛编程
解决Codeforces等编程竞赛题目
Codeforces评分963,百分位28.5%
面试准备
生成HumanEval+等编程面试题的解决方案
HumanEval+得分73.0
教育
编程学习
为学习者提供代码示例和解释
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase