P

Phi 4 Reasoning

由microsoft開發
Phi-4推理是基於Phi-4通過監督微調思維鏈軌跡數據集和強化學習訓練的前沿開放權重推理模型,專注於數學、科學和編程技能。
下載量 11.31k
發布時間 : 4/9/2025

模型概述

Phi-4推理是一個專注於數學推理、科學和編程的語言模型,通過高質量和高級推理數據進行訓練,適用於內存/計算受限環境和延遲敏感場景。

模型特點

高質量推理數據訓練
通過監督微調思維鏈軌跡數據集和強化學習訓練,專注於數學、科學和編程技能。
長上下文支持
支持32k詞元的上下文長度,適合處理複雜查詢和長文本推理。
安全對齊
通過監督微調採用強大的安全後訓練方法,確保模型響應符合安全與倫理準則。

模型能力

數學推理
科學問題解答
代碼生成
聊天對話
邏輯推理

使用案例

教育
數學問題解答
解答奧賽級數學問題,如AIME競賽題目。
在AIME 2024上達到75.3分
編程
代碼生成
生成功能性代碼,解決編程競賽問題。
在LiveCodeBench上達到53.8分
研究
科學問題解答
解答研究生級科學問題,如GPQA-Diamond數據集。
在GPQA-D上達到65.8分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase