P

Phi 4 Reasoning Unsloth Bnb 4bit

由unsloth開發
Phi-4-reasoning是一款由微軟開發的先進推理模型,基於Phi-4進行微調,專注於提升數學、科學和編碼等領域的推理能力。
下載量 1,969
發布時間 : 5/1/2025

模型概述

Phi-4-reasoning是一款開放權重的推理模型,通過監督微調和強化學習訓練,適用於需要複雜推理任務的場景。

模型特點

先進的推理能力
通過監督微調和強化學習,專注於數學、科學和編碼等領域的推理能力提升。
高效的架構設計
基於Phi-4基礎模型,採用14B參數的密集僅解碼器Transformer架構。
長上下文處理能力
支持32k令牌的上下文長度,能夠處理複雜的輸入。
廣泛評估驗證
在多個開源和內部基準測試中進行了評估,展示了出色的性能。

模型能力

數學推理
科學問題解答
代碼生成
算法問題解決
複雜輸入處理

使用案例

教育
數學奧林匹克問題解答
解決高難度的數學奧林匹克問題。
在AIME 2025基準測試中得分62.9。
科學問題解答
回答複雜的科學問題。
在GPQA-Diamond基準測試中得分65.8。
編程
代碼生成
生成功能代碼。
在HumanEvalPlus基準測試中得分92.9。
算法問題解決
解決3SAT和TSP等算法問題。
在LiveCodeBench基準測試中得分53.8。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase