P

Phi 4 Reasoning GGUF

unslothによって開発
Phi-4-reasoningはPhi-4をファインチューニングした先進的な推論モデルで、教師付きファインチューニングと強化学習により、数学、科学、コーディングなどの分野で卓越した推論能力を発揮します。
ダウンロード数 6,046
リリース時間 : 5/1/2025

モデル概要

Phi-4-reasoningは数学、科学、コーディングの推論に特化した言語モデルで、推論と論理に高い要求があるシナリオに適しています。

モデル特徴

先進的な推論能力
教師付きファインチューニングと強化学習により、数学、科学、コーディングなどの分野で卓越した推論能力を発揮します。
高い性能
複数の推論タスクと汎用能力のベンチマークテストで優れた成績を収め、多くのより大きなパラメータのオープンウェイトモデルを上回っています。
幅広い適用性
推論と論理に高い要求があるシナリオ、例えばメモリ/計算資源が制限された環境や低遅延シナリオなどに適しています。
安全な事後学習
強力な安全な事後学習方法を採用し、教師付きファインチューニング(SFT)によりモデルの安全性と倫理性を確保しています。

モデル能力

数学的推論
科学問題の解答
コード生成
複雑な問題の解決
論理的推論

使用事例

教育
数学オリンピック問題の解答
AIMEなどの数学オリンピック競技の複雑な問題を解決します。
AIME 2025で62.9%の正解率を達成
大学院レベルの科学問題の解答
GPQA-Diamondなどの複雑な大学院レベルの科学問題を解答します。
GPQA-Diamondで65.8%の正解率を達成
プログラミング
競技用コードの生成
競技レベルのコード解決策を生成します。
LiveCodeBenchで53.8%の正解率を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase