P

Phi 4 Reasoning Plus

由unsloth開發
Phi-4推理增強版是微軟研究院開發的140億參數開源推理模型,通過監督微調和強化學習優化,專注於數學、科學和編程領域的高級推理能力。
下載量 189
發布時間 : 5/1/2025

模型概述

基於Phi-4的增強版推理模型,通過高質量數據集和強化學習訓練,在數學推理、代碼生成和科學問題解決方面表現優異,支持32k上下文長度。

模型特點

強化推理能力
通過思維鏈追蹤數據集和強化學習優化,顯著提升複雜推理任務的準確性
長上下文處理
支持32k標記的上下文長度,可處理深度多步推理任務
高效架構
僅140億參數的小型模型實現接近更大模型的性能
安全對齊
通過嚴格的安全後訓練方法確保符合負責任AI準則

模型能力

數學問題求解
科學推理
代碼生成
算法問題解決
邏輯推理
多輪對話

使用案例

教育
數學奧賽輔導
解決AIME等數學競賽的複雜問題
在AIME 2025測試中達到78%準確率
科研
科學問題分析
解答研究生級別的科學問題
GPQA-Diamond基準68.9%準確率
軟件開發
競賽級代碼生成
解決編程競賽問題
LiveCodeBench基準53.1%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase