D

Deepseek R1 Zero

deepseek-aiによって開発
DeepSeek-R1はDeepSeekが開発した第一世代推論モデルで、強化学習によって訓練され、数学、コード、推論タスクで優れた性能を発揮します。
ダウンロード数 4,034
リリース時間 : 1/20/2025

モデル概要

DeepSeek-R1はDeepSeek-V3-Baseをベースに訓練された大規模推論モデルで、強化学習により推論能力を最適化し、128Kのコンテキスト長をサポートします。

モデル特徴

強化学習訓練
大規模な強化学習で直接ベースモデルを訓練し、教師あり微調整を予備ステップとして必要としません。
創発的推論能力
自己検証、反省、長い思考連鎖などの強力な推論行動が自然に創発します。
高性能推論
数学、コード、推論タスクにおいてOpenAI-o1と同等の性能を発揮します。
蒸留サポート
大規模モデルの推論モードを小規模モデルに蒸留することをサポートし、小規模モデルの性能を向上させます。

モデル能力

複雑な問題推論
数学問題解決
コード生成と理解
長文処理
多言語対応

使用事例

教育
数学問題解答
学生が複雑な数学問題を解決するのを助け、詳細な解答手順を提供します。
数学推論タスクで優れた性能を発揮
プログラミング
コード生成と最適化
要求に基づいて高品質なコードを生成し、既存のコードを最適化できます。
LiveCodeBenchで65.9 Pass@1-COTを達成
研究
複雑な問題分析
研究者が複雑な問題を分析するのを助け、多角的な思考を提供します。
GPQA-Diamondで71.5 Pass@1を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase