D

Deepcoder 1.5B Preview GGUF

由 Mungert 开发
基于DeepSeek-R1-Distilled-Qwen-1.5B微调的代码推理大语言模型,采用分布式强化学习技术扩展长上下文处理能力
下载量 888
发布时间 : 4/15/2025

模型简介

DeepCoder是一个专注于代码推理的大语言模型,通过强化学习技术优化了长上下文处理能力,适用于编程辅助和代码生成任务

模型特点

强化学习优化
采用改进版GRPO(GRPO+)和DeepScaleR提出的迭代上下文延长技术进行训练
长上下文处理
通过迭代上下文延长技术,模型能有效处理长达64K的上下文
代码推理能力
专注于编程问题的解决和代码生成,在多个编程基准测试中表现优异

模型能力

代码生成
编程问题解决
长上下文处理
文本生成

使用案例

编程辅助
算法问题解决
帮助解决Codeforces等平台上的算法问题
在Codeforces上达到963分(28.5百分位)
代码补全
为开发者提供代码补全建议
在HumanEval+上达到73.0分
教育
编程学习辅助
帮助学生理解和解决编程练习
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase