P

Phi 4 Reasoning GGUF

由 unsloth 开发
Phi-4-reasoning是基于Phi-4微调的先进推理模型,通过监督微调与强化学习,在数学、科学和编码等领域展现出卓越的推理能力。
下载量 6,046
发布时间 : 5/1/2025

模型简介

Phi-4-reasoning是一个专注于数学、科学和编码推理的语言模型,适用于对推理和逻辑有较高要求的场景。

模型特点

先进的推理能力
通过监督微调与强化学习,在数学、科学和编码等领域展现出卓越的推理能力。
高效的性能
在多个推理任务和通用能力基准测试中表现出色,超越了许多更大参数的开放权重模型。
广泛的适用性
适用于对推理和逻辑有较高要求的场景,如内存/计算受限的环境、低延迟场景等。
安全后训练
采用了强大的安全后训练方法,通过监督微调(SFT)确保模型的安全性和道德性。

模型能力

数学推理
科学问题解答
代码生成
复杂问题解决
逻辑推理

使用案例

教育
数学奥林匹克问题解答
解决AIME等数学奥林匹克竞赛中的复杂问题。
在AIME 2025上达到62.9%的准确率
研究生级科学问题解答
解答GPQA-Diamond等复杂的研究生级科学问题。
在GPQA-Diamond上达到65.8%的准确率
编程
竞赛代码生成
生成竞赛级别的代码解决方案。
在LiveCodeBench上达到53.8%的准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase