P

Phi 4 Reasoning

microsoftによって開発
Phi-4推論はPhi-4を基に、教師あり微調整の思考連鎖軌跡データセットと強化学習で訓練された最先端のオープンウェイト推論モデルで、数学、科学、プログラミングスキルに特化しています。
ダウンロード数 11.31k
リリース時間 : 4/9/2025

モデル概要

Phi-4推論は数学推論、科学、プログラミングに特化した言語モデルで、高品質で高度な推論データを用いて訓練されており、メモリ/計算リソースが限られた環境や遅延に敏感なシナリオに適しています。

モデル特徴

高品質推論データ訓練
教師あり微調整の思考連鎖軌跡データセットと強化学習で訓練され、数学、科学、プログラミングスキルに焦点を当てています。
長文脈サポート
32kトークンの文脈長をサポートし、複雑なクエリや長文の推論処理に適しています。
安全性アライメント
教師あり微調整により強力な安全性ポストトレーニング手法を採用し、モデルの応答が安全性と倫理基準に準拠することを保証します。

モデル能力

数学推論
科学的質問応答
コード生成
チャット対話
論理的推論

使用事例

教育
数学問題解答
AIME競技問題などのオリンピック級数学問題を解答します。
AIME 2024で75.3点を達成
プログラミング
コード生成
プログラミング競技問題を解決する機能的なコードを生成します。
LiveCodeBenchで53.8点を達成
研究
科学的質問応答
GPQA-Diamondデータセットなどの大学院レベルの科学的質問に解答します。
GPQA-Dで65.8点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase