P

Phi 4 Reasoning GGUF

由unsloth開發
Phi-4-reasoning是基於Phi-4微調的先進推理模型,通過監督微調與強化學習,在數學、科學和編碼等領域展現出卓越的推理能力。
下載量 6,046
發布時間 : 5/1/2025

模型概述

Phi-4-reasoning是一個專注於數學、科學和編碼推理的語言模型,適用於對推理和邏輯有較高要求的場景。

模型特點

先進的推理能力
通過監督微調與強化學習,在數學、科學和編碼等領域展現出卓越的推理能力。
高效的性能
在多個推理任務和通用能力基準測試中表現出色,超越了許多更大參數的開放權重模型。
廣泛的適用性
適用於對推理和邏輯有較高要求的場景,如內存/計算受限的環境、低延遲場景等。
安全後訓練
採用了強大的安全後訓練方法,通過監督微調(SFT)確保模型的安全性和道德性。

模型能力

數學推理
科學問題解答
代碼生成
複雜問題解決
邏輯推理

使用案例

教育
數學奧林匹克問題解答
解決AIME等數學奧林匹克競賽中的複雜問題。
在AIME 2025上達到62.9%的準確率
研究生級科學問題解答
解答GPQA-Diamond等複雜的研究生級科學問題。
在GPQA-Diamond上達到65.8%的準確率
編程
競賽代碼生成
生成競賽級別的代碼解決方案。
在LiveCodeBench上達到53.8%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase