D

Deepseek R1 Bf16

由opensourcerelease開發
DeepSeek-R1是第一代推理模型,在數學、代碼和推理任務上表現出色,性能可與OpenAI-o1相媲美。
下載量 1,486
發布時間 : 1/21/2025

模型概述

DeepSeek-R1是一個專注於數學、代碼和推理任務的大型語言模型,通過強化學習和冷啟動數據訓練,具有出色的推理能力和自我驗證能力。

模型特點

純強化學習訓練
無需監督微調(SFT)作為初步步驟,直接通過強化學習訓練模型
自我驗證能力
模型具備自我驗證和反思能力,能夠生成長思維鏈解決複雜問題
蒸餾支持
支持將大模型的推理能力蒸餾到小模型中,提升小模型性能
128K長上下文
支持長達128K的上下文長度,適合處理長文檔和複雜任務

模型能力

數學推理
代碼生成
複雜問題解決
長文本處理
自我驗證
思維鏈生成

使用案例

教育
數學問題解答
解決高中數學競賽題目
在AIME 2024測試中達到79.8% pass@1
編程教育
生成編程練習和解答
在LiveCodeBench測試中達到65.9% pass@1
軟件開發
代碼生成
根據需求生成功能代碼
在Codeforces測試中達到2029評分
代碼調試
分析並修復代碼中的錯誤
在SWE Verified測試中解決49.2%的問題
研究
科學問題解答
解決複雜科學問題
在GPQA-Diamond測試中達到71.5% pass@1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase