P

Phi 4 Reasoning Plus GGUF

由unsloth開發
Phi-4-reasoning-plus 是由微軟研究院開發的開源推理模型,專注於數學、科學和編程領域的高級推理能力。
下載量 109.62k
發布時間 : 5/1/2025

模型概述

Phi-4-reasoning-plus 是一個基於 Phi-4 的先進推理模型,通過監督微調和強化學習在鏈式思維跟蹤數據集上進行訓練,專注於數學、科學和編程技能。

模型特點

高級推理能力
專注於數學、科學和編程領域的高級推理任務,通過監督微調和強化學習優化。
長上下文支持
支持長達32k標記的上下文長度,適合處理複雜任務。
高性能
在多個推理基準測試中表現優異,優於同類模型。
安全對齊
通過嚴格的安全後訓練方法,確保模型在安全和道德準則下的使用。

模型能力

數學問題解答
科學問題解答
編程問題解決
鏈式思維推理
文本生成

使用案例

教育
數學奧林匹克問題解答
解決高難度的數學奧林匹克問題,如AIME和OmniMath中的題目。
在AIME 2025上達到78.0%的準確率。
研究生水平科學問題解答
解答覆雜的、研究生水平的科學問題,如GPQA-Diamond中的題目。
在GPQA-D上達到68.9%的準確率。
編程
競爭性編程問題解答
解決來自競爭性編程競賽的代碼生成問題,如LiveCodeBench中的題目。
在LiveCodeBench上達到53.1%的準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase