P

Phi 4 Reasoning Plus

由microsoft開發
Phi-4-reasoning-plus 是微軟研究院開發的先進開放權重推理模型,基於 Phi-4 通過監督微調和強化學習優化,專注於數學、科學和編碼領域的高級推理能力。
下載量 19.83k
發布時間 : 4/17/2025

模型概述

Phi-4-reasoning-plus 是一個高效的推理模型,通過思維鏈追蹤數據集和強化學習進行優化,特別擅長數學推理、科學問題和代碼生成任務。

模型特點

高級推理能力
通過監督微調和強化學習優化,特別擅長數學推理、科學問題和代碼生成任務。
長上下文處理
支持 32k 令牌的上下文長度,在處理長序列時保持連貫性和邏輯一致性。
結構化響應
響應分為思維鏈推理塊和總結塊,提供詳細的推理過程和精確的解決方案。
高效訓練
使用 160 億令牌的訓練數據,在 32 H100-80G GPU 上訓練 2.5 天完成。

模型能力

數學推理
科學問題解答
代碼生成
聊天對話
邏輯推理

使用案例

教育
數學問題解答
解決複雜的數學問題,如奧林匹克數學題。
在 AIME 2025 上達到 78.0 分
科學問題解答
回答研究生水平的科學問題。
在 GPQA-Diamond 上達到 68.9 分
編程
代碼生成
生成功能性代碼,解決編程競賽問題。
在 LiveCodeBench 上達到 53.1 分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase