O

Olmo 2 0425 1B Instruct

allenaiによって開発
OLMo 2 1Bはallenai/OLMo-2-0425-1B-RLVR1モデルの後訓練バリアントで、教師あり微調整、DPOトレーニング、RLVRトレーニングを経ており、様々なタスクで最先端の性能を実現することを目的としています。
ダウンロード数 5,127
リリース時間 : 4/29/2025

モデル概要

OLMo 2 1Bはオープン言語モデルで、主にテキスト生成タスクに使用され、英語をサポートし、研究および教育用途に適しています。

モデル特徴

オープン言語モデル
OLMoシリーズのモデルは言語モデルの科学研究を推進することを目的としており、すべてのコード、チェックポイント、ログ、および関連するトレーニング詳細を公開しています。
マルチタスク性能
MATH、GSM8K、IFEvalなどの様々なタスクで優れたパフォーマンスを発揮します。
RLVRトレーニング
RLVRトレーニングを経ており、RL微調整研究を促進するための中間チェックポイントを提供しています。

モデル能力

テキスト生成
マルチタスク処理
命令追従

使用事例

教育
数学問題解答
GSM8KやMATHデータセットの問題など、数学の問題を解答します。
GSM8Kで68.3点、MATHで20.7点を達成。
研究
言語モデル研究
言語モデルの微調整や性能研究に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase