D

Deepseek Prover V2 671B GGUF

由unsloth開發
專為 Lean 4 形式化定理證明設計的開源大型語言模型,通過遞歸定理證明流程和強化學習訓練,實現了卓越的準確性。
下載量 14.89k
發布時間 : 5/1/2025

模型概述

DeepSeek-Prover-V2 是一個專為 Lean 4 形式化定理證明設計的開源大型語言模型,通過遞歸定理證明流程和強化學習訓練,實現了卓越的準確性。

模型特點

遞歸定理證明流程
通過遞歸定理證明流程收集初始數據,利用 DeepSeek-V3 進行子目標分解和形式化,生成冷啟動推理數據。
強化學習訓練
在合成冷啟動數據上進行微調後,執行強化學習階段,進一步增強模型將非正式推理與形式化證明構建聯繫起來的能力。
高性能
在 MiniF2F-test 上達到了 88.9% 的通過率,並解決了 PutnamBench 中的 49 個問題。

模型能力

形式化定理證明
數學推理
子目標分解
證明構建

使用案例

數學定理證明
MiniF2F 數據集證明
在 MiniF2F-test 上達到了 88.9% 的通過率。
88.9% 的通過率
PutnamBench 問題解決
解決了 PutnamBench 中的 49 個問題。
49 個問題解決
教育
教科書問題形式化
用於形式化教科書中的數學問題,幫助學生理解複雜數學概念。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase