D

Deepseek R1 Bf16

由 opensourcerelease 开发
DeepSeek-R1是第一代推理模型,在数学、代码和推理任务上表现出色,性能可与OpenAI-o1相媲美。
下载量 1,486
发布时间 : 1/21/2025

模型简介

DeepSeek-R1是一个专注于数学、代码和推理任务的大型语言模型,通过强化学习和冷启动数据训练,具有出色的推理能力和自我验证能力。

模型特点

纯强化学习训练
无需监督微调(SFT)作为初步步骤,直接通过强化学习训练模型
自我验证能力
模型具备自我验证和反思能力,能够生成长思维链解决复杂问题
蒸馏支持
支持将大模型的推理能力蒸馏到小模型中,提升小模型性能
128K长上下文
支持长达128K的上下文长度,适合处理长文档和复杂任务

模型能力

数学推理
代码生成
复杂问题解决
长文本处理
自我验证
思维链生成

使用案例

教育
数学问题解答
解决高中数学竞赛题目
在AIME 2024测试中达到79.8% pass@1
编程教育
生成编程练习和解答
在LiveCodeBench测试中达到65.9% pass@1
软件开发
代码生成
根据需求生成功能代码
在Codeforces测试中达到2029评分
代码调试
分析并修复代码中的错误
在SWE Verified测试中解决49.2%的问题
研究
科学问题解答
解决复杂科学问题
在GPQA-Diamond测试中达到71.5% pass@1
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase