D

Deepseek R1

deepseek-aiによって開発
DeepSeek-R1は深度求索が開発した第一世代推論モデルで、大規模な強化学習トレーニングにより、数学、コード、推論タスクで優れた性能を発揮します。
ダウンロード数 1.7M
リリース時間 : 1/20/2025

モデル概要

DeepSeek-R1はMoEアーキテクチャに基づく大規模言語モデルで、2段階の強化学習と教師ありファインチューニングによりトレーニングされ、複雑な推論能力の向上に焦点を当てています。

モデル特徴

純粋な強化学習トレーニング
DeepSeek-R1-Zeroバージョンは完全に強化学習でトレーニングされ、教師ありファインチューニング不要で、自然に出現する推論能力を示します
2段階トレーニングプロセス
推論パターンの発見と人間の嗜好への適合のための2つのRL段階、および能力の種としての2つのSFT段階を含みます
強力な推論能力
数学、コード、複雑な推論タスクで優れた性能を発揮し、OpenAI-o1に匹敵します
知識蒸留サポート
大規模モデルの推論能力を小型モデルに蒸留し、小型モデルの性能を向上させます

モデル能力

複雑な数学問題解決
コード生成と理解
長文推論
多段階論理推論
自己検証と反省
思考連鎖生成

使用事例

教育
数学問題解答
証明問題や計算問題を含む複雑な数学問題を解決
数学ベンチマークテストで優れた成績
プログラミング
コード生成
問題説明に基づいて機能コードを生成
LiveCodeBenchで65.9%のPass@1-COTを達成
研究
科学的推論
複雑な科学問題と推論タスクを処理
GPQA-Diamondテストで71.5%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase