P

Phi 4 Reasoning Plus Unsloth Bnb 4bit

由 unsloth 开发
Phi-4-reasoning-plus是微软基于Phi-4微调的最先进开放权重推理模型,专注于数学、科学和编码领域的高级推理能力。
下载量 3,504
发布时间 : 5/1/2025

模型简介

该模型通过监督微调和强化学习训练,具有强大的推理和逻辑能力,适用于需要低延迟和高准确性的场景。

模型特点

高性能推理
相比其他模型,运行速度快2倍,内存使用减少50%
强化学习训练
通过额外的强化学习训练,提高了准确性,但生成令牌数增加50%
多平台支持
可导出到Ollama、llama.cpp或HF等平台
长上下文处理
支持32k令牌的上下文长度,在扩展输入上保持连贯性

模型能力

数学推理
科学问题解答
代码生成
逻辑分析
多步推理
指令跟随

使用案例

教育
数学问题解答
解决奥林匹克级数学问题
在AIME 2025基准上达到78.0分
科学问题解答
回答研究生水平的复杂科学问题
在GPQA-Diamond基准上达到68.9分
编程
代码生成
生成功能代码
在HumanEvalPlus基准上达到92.3分
算法问题解决
解决3SAT和TSP等算法问题
表现出强大的泛化能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase