P

Phi 4 Reasoning Unsloth Bnb 4bit

unslothによって開発
Phi-4-reasoningは、Microsoftによって開発された高度な推論モデルで、Phi-4をベースに微調整され、数学、科学、コーディングなどの分野での推論能力の向上に特化しています。
ダウンロード数 1,969
リリース時間 : 5/1/2025

モデル概要

Phi-4-reasoningは、オープンウェイトの推論モデルで、教師付き微調整と強化学習によって訓練され、複雑な推論タスクが必要なシチュエーションに適しています。

モデル特徴

高度な推論能力
教師付き微調整と強化学習により、数学、科学、コーディングなどの分野での推論能力を向上させます。
効率的なアーキテクチャ設計
Phi-4ベースモデルをベースに、140億パラメータの密集型のデコーダーのみのTransformerアーキテクチャを採用しています。
長文脈処理能力
32kトークンの文脈長をサポートし、複雑な入力を処理できます。
広範な評価検証
複数のオープンソースと内部のベンチマークテストで評価され、優れた性能を示しています。

モデル能力

数学推論
科学問題の解答
コード生成
アルゴリズム問題の解決
複雑な入力の処理

使用事例

教育
数学オリンピック問題の解答
高難度の数学オリンピック問題を解きます。
AIME 2025ベンチマークテストで62.9点を獲得しました。
科学問題の解答
複雑な科学問題に答えます。
GPQA-Diamondベンチマークテストで65.8点を獲得しました。
プログラミング
コード生成
機能コードを生成します。
HumanEvalPlusベンチマークテストで92.9点を獲得しました。
アルゴリズム問題の解決
3SATやTSPなどのアルゴリズム問題を解きます。
LiveCodeBenchベンチマークテストで53.8点を獲得しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase