D

Deepcoder 1.5B Preview AWQ

由adriabama06開發
DeepCoder-1.5B-Preview是一款基於代碼推理的大型語言模型,通過分佈式強化學習從DeepSeek-R1-Distilled-Qwen-1.5B微調而來,能夠處理更長的上下文長度。
下載量 72
發布時間 : 4/13/2025

模型概述

DeepCoder-1.5B-Preview是一款專注於代碼推理的大型語言模型,通過改進的GRPO+訓練方法和迭代上下文延長技術,提升了長上下文處理能力。

模型特點

強化學習微調
採用改進版GRPO+算法進行微調,結合DAPO的見解實現更穩定的訓練
長上下文處理
通過迭代上下文延長技術,支持64K上下文長度的推理
4位量化
採用AWQ 4位128g量化技術,提高推理效率
開放許可
採用MIT許可證,促進AI技術的民主化

模型能力

代碼生成
長上下文理解
編程問題解答
代碼推理

使用案例

編程輔助
編程問題解答
解決各類編程競賽和麵試中的算法問題
在LiveCodeBench(v5)上達到25.1%準確率
代碼生成
根據自然語言描述生成功能代碼
HumanEval+得分73.0
教育
編程學習輔助
幫助學生理解和解決編程練習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase