D

Deepseek R1 Distill Qwen 32B Unsloth Bnb 4bit

unslothによって開発
DeepSeek-R1はDeepSeekチームによって開発された初代推論モデルで、大規模な強化学習トレーニングを通じて、教師付き微調整(SFT)を最初のステップとせずに、卓越した推論能力を発揮します。
ダウンロード数 938
リリース時間 : 1/22/2025

モデル概要

DeepSeek-R1シリーズのモデルは推論タスクに特化しており、自己検証、反省、長い思考チェーン(CoT)の生成能力を備えており、数学、コード、推論タスクに適しています。

モデル特徴

高速微調整
Unslothが大規模言語モデルの微調整を支援し、速度を2 - 5倍に向上させ、メモリ使用量を70%削減します。
強力な推論能力
数学、コード、推論タスクでの性能はOpenAI - o1と匹敵し、一部の蒸留モデルはOpenAI - o1 - miniを上回ります。
動的量子化
1.58ビット + 2ビットの動的量子化は選択的量子化を行い、標準の1ビット/2ビット量子化と比較して、精度が大幅に向上します。
オープンソース蒸留モデル
LlamaとQwenに基づいて、DeepSeek - R1から蒸留された6つの密集モデルをオープンソース化し、研究コミュニティにより多くの選択肢を提供します。

モデル能力

数学問題の解決
コード生成
長文推論
自己検証
反省能力
長い思考チェーン(CoT)の生成

使用事例

数学問題の解決
AIME 2024数学競技問題の解決
DeepSeek - R1はAIME 2024の競技問題でpass@1が79.8%に達し、GPT - 4oとClaude - 3.5 - Sonnetを上回ります。
79.8% pass@1
MATH - 500数学問題の解決
MATH - 500データセットでは、DeepSeek - R1のpass@1が97.3%に達し、優れた性能を発揮します。
97.3% pass@1
コード生成
LiveCodeBenchコード生成
DeepSeek - R1はLiveCodeBenchでpass@1 - COTが65.9%に達し、GPT - 4oとClaude - 3.5 - Sonnetより優れています。
65.9% pass@1 - COT
Codeforcesプログラミング競技問題の解決
DeepSeek - R1はCodeforcesの競技問題で評点が2029に達し、OpenAI o1 - 1217の2061に近いです。
2029評点
推論タスク
MMLUマルチタスク言語理解
DeepSeek - R1はMMLUデータセットでpass@1が90.8%に達し、優れた性能を発揮します。
90.8% pass@1
DROP読解
DROPデータセットでは、DeepSeek - R1の3 - shot F1が92.2%に達し、GPT - 4oとClaude - 3.5 - Sonnetを上回ります。
92.2% 3 - shot F1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase