D

Deepcoder 1.5B Preview GGUF

Mungertによって開発
DeepSeek-R1-Distilled-Qwen-1.5Bをファインチューニングしたコード推論大規模言語モデルで、分散型強化学習技術を用いて長文脈処理能力を拡張
ダウンロード数 888
リリース時間 : 4/15/2025

モデル概要

DeepCoderはコード推論に特化した大規模言語モデルで、強化学習技術により長文脈処理能力を最適化し、プログラミング支援やコード生成タスクに適しています

モデル特徴

強化学習最適化
改良版GRPO(GRPO+)とDeepScaleRが提案する反復的文脈延長技術を用いて訓練
長文脈処理
反復的文脈延長技術により、最大64Kの長文脈を効果的に処理可能
コード推論能力
プログラミング問題解決とコード生成に特化し、複数のプログラミングベンチマークで優れた性能を発揮

モデル能力

コード生成
プログラミング問題解決
長文脈処理
テキスト生成

使用事例

プログラミング支援
アルゴリズム問題解決
Codeforcesなどのプラットフォーム上のアルゴリズム問題解決を支援
Codeforcesで963点(28.5パーセンタイル)を達成
コード補完
開発者にコード補完の提案を提供
HumanEval+で73.0点を達成
教育
プログラミング学習支援
学生がプログラミング演習を理解し解決するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase