D

Deepcoder 1.5B Preview AWQ

Developed by adriabama06
DeepCoder-1.5B-Previewは、コード推論に特化した大規模言語モデルで、分散型強化学習によりDeepSeek-R1-Distilled-Qwen-1.5Bからファインチューニングされ、より長い文脈長を処理できます。
Downloads 72
Release Time : 4/13/2025

Model Overview

DeepCoder-1.5B-Previewは、コード推論に焦点を当てた大規模言語モデルで、改良されたGRPO+トレーニング手法と反復的文脈延長技術により、長文脈処理能力を向上させています。

Model Features

強化学習ファインチューニング
改良版GRPO+アルゴリズムを使用したファインチューニングを採用し、DAPOの知見を組み合わせてより安定したトレーニングを実現
長文脈処理
反復的文脈延長技術により、64K文脈長の推論をサポート
4ビット量子化
AWQ 4ビット128g量子化技術を採用し、推論効率を向上
オープンライセンス
MITライセンスを採用し、AI技術の民主化を促進

Model Capabilities

コード生成
長文脈理解
プログラミング問題解答
コード推論

Use Cases

プログラミング支援
プログラミング問題解答
様々なプログラミングコンテストや面接でのアルゴリズム問題を解決
LiveCodeBench(v5)で25.1%の精度を達成
コード生成
自然言語の説明に基づいて機能コードを生成
HumanEval+スコア73.0
教育
プログラミング学習支援
学生がプログラミング演習を理解し解決するのを支援
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase