D

Deepseek R1 Bf16

opensourcereleaseによって開発
DeepSeek-R1は第一代の推論モデルで、数学、コード、推論タスクで優れた性能を発揮し、その性能はOpenAI-o1に匹敵します。
ダウンロード数 1,486
リリース時間 : 1/21/2025

モデル概要

DeepSeek-R1は数学、コード、推論タスクに特化した大規模言語モデルで、強化学習とコールドスタートデータを用いて訓練され、優れた推論能力と自己検証能力を持っています。

モデル特徴

純粋な強化学習訓練
教師付き微調整(SFT)を最初のステップとして必要とせず、直接強化学習でモデルを訓練します。
自己検証能力
モデルは自己検証と反省能力を備え、複雑な問題を解決するための長い思考チェーンを生成することができます。
蒸留サポート
大規模モデルの推論能力を小規模モデルに蒸留し、小規模モデルの性能を向上させることをサポートします。
128Kの長文脈
最大128Kの文脈長をサポートし、長いドキュメントや複雑なタスクの処理に適しています。

モデル能力

数学推理
コード生成
複雑問題解決
長文処理
自己検証
思考チェーン生成

使用事例

教育
数学問題解答
高校数学コンテストの問題を解く
AIME 2024テストで79.8% pass@1を達成
プログラミング教育
プログラミング練習と解答を生成する
LiveCodeBenchテストで65.9% pass@1を達成
ソフトウェア開発
コード生成
要求に応じて機能コードを生成する
Codeforcesテストで2029点を獲得
コードデバッグ
コード内のエラーを分析して修正する
SWE Verifiedテストで49.2%の問題を解決
研究
科学問題解答
複雑な科学問題を解く
GPQA-Diamondテストで71.5% pass@1を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase