O

Olmo 2 0425 1B SFT

由allenai開發
OLMo 2 1B SFT是基於OLMo-2-0425-1B模型的監督微調版本,在Tulu 3數據集上訓練,旨在實現多種任務的最先進性能。
下載量 1,759
發布時間 : 4/24/2025

模型概述

這是一個開放語言模型,主要用於英語文本生成任務,基於Apache 2.0許可證發佈,適合研究和教育用途。

模型特點

開放語言模型
完全開放源代碼、權重和訓練數據,推動語言模型科學研究
多任務優化
在Tulu 3數據集上微調,優化了MATH、GSM8K和IFEval等多種任務性能
透明訓練
公開所有訓練代碼、檢查點和日誌,確保研究可復現性

模型能力

文本生成
對話系統
數學問題解答
事實問答

使用案例

教育
數學問題解答
解答GSM8K和MATH數據集中的數學問題
在GSM8K上達到52.1分,MATH上13.2分
研究
語言模型研究
用於語言模型行為和能力的研究
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase