P

Phi 4 Reasoning Plus

unslothによって開発
Phi-4推論強化版はマイクロソフトリサーチが開発した140億パラメータのオープンソース推論モデルで、教師あり微調整と強化学習による最適化を経ており、数学、科学、プログラミング分野の高度な推論能力に特化しています。
ダウンロード数 189
リリース時間 : 5/1/2025

モデル概要

Phi-4を基にした強化版推論モデルで、高品質データセットと強化学習によるトレーニングを通じ、数学推論、コード生成、科学問題解決において優れた性能を発揮し、32kの文脈長をサポートします。

モデル特徴

強化された推論能力
思考連鎖追跡データセットと強化学習による最適化で、複雑な推論タスクの精度を大幅に向上
長文脈処理
32kトークンの文脈長をサポートし、深い多段階推論タスクを処理可能
効率的なアーキテクチャ
わずか140億パラメータの小型モデルで、より大規模なモデルに近い性能を実現
安全整合
厳格な安全後処理手法により、責任あるAIガイドラインへの準拠を確保

モデル能力

数学問題解決
科学推論
コード生成
アルゴリズム問題解決
論理推論
マルチターン対話

使用事例

教育
数学オリンピック指導
AIMEなどの数学競技会の複雑な問題を解決
AIME 2025テストで78%の正答率を達成
研究
科学問題分析
大学院レベルの科学問題に解答
GPQA-Diamondベンチマークで68.9%の正答率
ソフトウェア開発
競技レベルのコード生成
プログラミング競技の問題を解決
LiveCodeBenchベンチマークで53.1%の正答率
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase